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INTRODUCERE ÎN MANAGEMENTUL 
ASISTAT DE CALCULATOR 


1.1. INTRODUCERE 


Infrastructura transporturilor reprezintă o avutie publica de o valoare imensă 
care trebuie transmisă într-o stare multumitoare către generaţiile viitoare. 
Responsabilitatea factorilor de decizie este cu atât mai mare cu cât de buna 
funcţionare a căilor de comunicaţie depinde desfăşurarea normală a întregii activități 
economice a ţării, securitatea colectivă şi, bineînțeles, siguranța participanților la 
trafic. 


Mentinerea in stare de funcţionare a infrastructurii depinde de modul in care 
administratorul reţelei efectuează acțiuni de intervenţie. Pentru ca aceste acţiuni să fie 
eficiente trebuie cunoscut în amănunt situația calitativă şi funcţională a 
componentelor. Pentru aceasta sunt necesare programe sistematice de inventariere, 
inspecţie şi evaluare. Scopul unor astfel de programe este de a stabili capacitatea 
actuală şi de perspectivă a infrastructurii de a face fata cerinţelor şi scopului pentru 
care a fost realizată. 


Pe baza datelor existente se pot stabili strategii, programe, proiecte, soluții 
etc. Pentru realizarea lor sunt necesare fonduri substanțiale. Suma valorii tuturor 
proiectelor reprezintă bugetul necesar pentru administrare. Practica a demonstrat că 
fondurile disponibile nu sunt niciodată suficiente nicăieri în lume. Deoarece pentru 
aceleaşi fonduri concurează mai multe proiecte, administratorii trebuie să aleagă între 
acestea. Ei trebuie să aleagă între proiecte localizate în diverse situri dar şi între 
variante de proiect pentru aceeaşi locaţie. 
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Decizia este dificilă deoarece în cele mai multe cazuri este necesară predicția 
efectelor diferitelor proiecte. În final trebuie selectate acele proiecte care aduc cele 
mai mari beneficii. Prin beneficii trebui să înţelegem nu numai valoarea bănească ci şi 
de altă natură cum ar fi timp, consum de combustibil şi piese de schimb etc. Studiul 
sistematic al mecanismelor matematice şi logice de descriere a comportării reţelei şi 
utilizatorilor, combinat cu dezvoltarea şi utilizarea de algoritmi de predictie, poate 
ajuta la eliminarea sau întârzierea apariției unor fenomene negative sau se pot 
minimiza efectele lor încă înainte de apariție. 


Simultan cu programele de întreţinere a infrastructurii trebuie iniţiate şi 
parcurse permanent programe de culegere de date pentru a putea cunoaşte starea şi 
evoluţia sistemului. O cunoaştere mai profundă implică utilizarea unui număr cât mai 
mare de variabile de descriere. Numărul combinațiilor posibile devine astfel tot mai 
mare şi mintea umană poate tot mai greu să le cuprindă şi să le controleze integral. În 
consecinţă, se impune o gândire sistemică şi o abordare algoritmică. Complexitatea 
tot mai mare a algoritmilor şi dimensiunea crescândă a bazelor de date în care se 
stochează datele impun utilizarea calculatoarelor ca mijloc de lucru. 


evaluare, analiză economică, metode moderne de management. Termenul generic este 
management asistat de calculator. Scopul unui astfel de mecanism este de a obține un 
beneficiu maxim din utilizarea resurselor disponibile. 


Managementul infrastructurii rutiere se confruntă cu o permanentă obligaţie 
de a lua decizii. Aceste decizii se referă la alocarea de resurse, fie ele materiale, 
financiare, umane sau de echipament. În contextual actual de desfăşurare a proceselor 
alocarea este irevocabilă. 


Avem aici câteva noţiuni ce necesită o explicaţie. Irevocabil şi decizie vor fi 
reţinuţi cu înţelesul exprimat de R.A. Howard (1966) [12]: 


„ -~ irevocabil în sensul că este imposibil sau extrem de costisitor să revenim 
la situația care exista înainte de luarea deciziei. De aceea pentru scopul 
propus decizie nu este hotărârea mintală de a urma o anumită linie de acţiune 
ci mai degrabă ducerea la îndeplinire a acțiunii în conformitate cu hotărârea. ” 


Procesul decizional este unul complex afectat frecvent de subiectivism şi de 
incertitudine. O dată cu pătrunderea calculatorului electronic în majoritatea 
domeniilor vieţii şi managementul infrastructurii transporturilor rutiere trebuie să 
beneficieze de avantajele utilizării noilor tehnologii. Viteza de calcul deosebită, 
capacitatea de stocare a datelor şi procedurile sofisticate de prelucrare permit 
specialistului în inginerie civilă să facă analize pertinente, multicriteriale care să 
permită luarea de decizii corecte, documentate şi argumentate. 
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1.2. OBIECTUL CURSULUI 


Acest curs va trata modul în care datele, informațiile şi cunoştinţele pot fi 
obținute, stocate, regăsite şi prelucrate pentru a fi utilizate în managementul 
infrastructurii transporturilor. Un accent deosebit se va pune pe metodele algoritmice 
de procesare cu scopul luării deciziilor. 


În capitolele următoare vom face doar o trecere în revistă şi o introducere în 
mijloacele moderne de analiză care transpuse în programe rulate pe calculatoarele 
moderne pot oferi sprijin în procesul decizional al managementului infrastructurii 
transporturilor. Considerăm că este de o importanță deosebită cunoaşterea unor 
noţiuni de bază privind: 


e Definirea, reprezentarea şi gruparea datelor; 

e Achiziţionarea, stocarea, regăsirea şi actualizarea datelor în baze de date; 

e Prelucrarea datelor pe baza algoritmilor pentru obținerea de informaţii; 

e Aplicaţii ale utilizării bazelor de date şi a algoritmilor în managementul 
infrastructurii transporturilor; 

e Modelarea şi simularea în vederea prelucrării datelor . 


Studierea şi aprofundarea acestor noțiuni permite colaborarea facilă cu ceilalți 
specialişti implicaţi în colective multidisciplinare care tratează probleme de trafic, 
administrarea infrastructurii, sisteme informaționale integrate, dirijarea 
transporturilor, cercetări operaționale etc. 


Acest curs NU se va ocupa de: limbaje de programare, arhitectură hardware, 
arhitectură software sau de problematica proiectării şi implementării de programe de 
calcul. Acestea sunt doar tangential abordate. Chiar dacă nu este absolut necesară, 
cunoaşterea unui limbaj de programare va facilita buna înțelegere a noțiunilor cu care 
ne vom confrunta. 


Acest curs NU se ocupă de teoria şi practica managementului cu aplicare în 
rețeaua infrastructurii transportului rutier. Este totuşi strâns interconectat, logica şi 
metodele de raționament însuşite în cadrul acestui curs putând fi aplicate în 
rezolvarea nevoilor managementului. 


1.3. DATE, INFORMAȚII, CUNOŞTINŢE 


In managementul infrastructurii rutiere, de altfel ca în multe alte domenii şi 
ca în viaţa însăşi, există o activitate susținută şi permanentă de culegere, prelucrare, 
generare şi transmitere a datelor, informaţiilor şi cunoştinţelor. 


La nivelul elementar putem spune următoarele: 


e Datele — reprezintă elemente simbolice de bază, cărămida în construcția 
cunoaşterii; 
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e Informația — reprezintă datele prelucrate pentru a corespunde unui scop şi 
care răspunde la întrebările: Cine? Ce? Unde? Când? Cât? 

e Cunostintele — aplicaţia datelor şi informaţiilor şi răspunde la întrebarea: 
Cum? 

e Înțelegerea — apreciază: De ce? 

e Înţelepciunea — apreciază înţelegerea? 


Pentru a asigura o bună înţelegere a conceptelor cuprinse în această lucrare şi 
a desfăşurării proceselor decizionale care decurg la diferitele niveluri ale 
managementului infrastructurii transporturilor vom insista asupra noţiunilor de date, 
informaţii şi cunoştinţe. Celelalte depăşesc limitele pe care ni le-am impus şi pot fi 
abordate într-o eventuală lucrare de filozofia cunoaşterii. 


Informaţiile şi cunoştinţele se obțin din prelucrarea datelor după o schemă 
principială prezentată în figura următoare. 


DATE 


Y 
ia 
Y 


— INFORMAȚII i 
= 


E CUNOSTINTE 


Fig. 1 Procesul de transformare a datelor in cunoştinţe [13] 


DATELE 


Activitatea specialiştilor din domeniu este caracterizată prin entități factice 
exprimate fie sub formă de valori numerice, fie ca percepții şi observaţii numerice. 
Aceste entități faptice independente şi neevaluate, existente în număr mare, se numesc 
date [13]. 


Datele sunt o reprezentare a observaţiilor, faptelor, conceptelor sau 
instrucțiunilor într-o manieră formală adaptată comunicării, procesării şi interpretării 
de către om sau cu mijloace automatizate. 

Date sunt toate acele valori numerice, caracter, sau de altă natură ce pot fi 


păstrate separat sau grupate pentru a fi stocate, regăsite, transmise, prelucrate etc. 
pentru a obţine informaţii. 
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Datele reprezintă elementul de bază, materia primă, în procesul decizional. 
Pot avea diferite reprezentări şi pot fi utilizabile sau nu. Ele pot exista în variate 
forme: numere, texte, mulțimi, colecţii etc., dar nu au semnificaţie prin ele însele. 


Datele pot fi de patru tipuri (Floridi-1999 [10]): 


e Date primare — datele brute culese din teren, stocate în bazele de date sau 
înscrise în cărți, simple înşiruiri de valori care nu au suferit o prelucrare 
prealabilă sau procesul de prelucrare a fost sumar. Sistemele de gestiune a 
informaţiilor sunt proiectate, în fapt, să manipuleze în special astfel de date. 

e Metadate — sunt date secundare care oferă indicații şi descriere privind natura 
datelor primare. Ajută sistemele de gestiune a bazelor de date să-şi 
îndeplinească sarcina prin descrierea proprietăţilor esenţiale ale datelor 
primare: localizare, format, actualizare, disponibilitate, drepturi de autor, 
etc. 

e Date operaţionale — sistemele de gestiune a bazelor de date monitorizează şi 
colectează date privind propria funcționare, despre funcționarea sistemului 
de calcul sau a performanţelor implementării. Aceste date pot asigura 
feedback-ul, bucla de control, pentru identificarea şi corectarea 
eventualelor erori de funcționare, a greşelilor de proiectare sau a 
neconcordantelor cu necesităţile utilizatorului; 

e Date derivate — sunt acele date care pot fi deduse sau extrase din tipurile 
anterioare când acestea sunt utilizate pentru comparații şi analize 
cantitative. 


Ca toate produsele societăţii umane datele au o un ciclu de viata. Funcție de 
durata lor de viata datele pot fi: 


e Volatile: date care se obţin, se prelucrează, se utilizează în generarea 
informaţiilor sau altor tipuri de date şi a căror valoare nu se păstrează, sau 

e Persistente: date stocate pe un suport de informatie cum ar fi hârtie, benzi 
perforate, mijloace magnetice (benzi, dischete, discuri), mijloace optice 
(compact discuri) etc. 


INFORMAȚIA 


Datele obţinute în cadrul activităților de proiectare, execuţie, investigație, 
mentenanţă etc. constituie un material informațional brut care poate fi ordonat şi 
prelucrat, având în vedere diferite obiective. În urma acestui proces de transformare a 
datelor, se obțin informaţii, care reprezintă o interpretare a datelor în conformitate cu 
anumite situații particulare sau cu înţelegerea de către mintea umană in general. 


Informaţia este trecerea de la valoare la semnificaţia care se ataşează datei. 
Intelesul care se ataşează datelor depinde de locul, modul şi scopul obţinerii lor. 
Această semnificaţie poate fi utilă dar acest lucru nu este obligatoriu. 


eee Lawl wamal 
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Există numeroase încercări de a defini informaţia. Fiecare este adevărată pe 
domenii limitate dar nici una nu este suficient de generală. Studii de sinteză făcute de- 
a lungul timpului nu au găsit la autorii citați o unitate de vedere (Braman 1989 [3], 
Losee 1997 [15], Machlup 1983 [17], NATO 1974 [21], 1975 [22], 1983 [23], 


Schrader 1984 [25], Wellisch 1972 [32], Wersig şi Neveling 1975 [33)). Desi pare o 
noţiune simplă, conceptul de informatie este greu de cuprins într-o singură definiţie şi 
poate fi explicat în moduri diferite funcţie de categoria de cerinţe şi deziderate care 
orientează teoria (Bar-Hillel şi Carnap 1953 [1], Szaniawski 1984 [29], Shannon 1993 
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Dintre definițiile date şi comentariile făcute putem reţine: 


e Informaţia reprezintă datele care au fost procesate într-o formă inteligibilă 
pentru receptor (Davis şi Olson 1985 [6]); 

e Datele reprezintă materia primă care este procesată şi rafinată pentru a obține 
informaţia (Silver şi Silver 1989 [28]); 

e Informatie egal date plus semnificaţie (Checkland şi Scholes 1990 [5]); 

e Informatia este setul de date care a fost interpretat si inteles de receptorul 
mesajului (Lucey 1991 [16]); 

e Datele trebuie interpretate sau prelucrate pentru a deveni informatie 
(Warner 1996 [31]). 


Noţiunea de informatie este adesea utilizată intuitiv pentru a desemna 
conţinutul semantic non-ntental, independent de utilizator, declarativ inclus in 
implementări fizice precum baze de date, enciclopedii, locaţii internet, programe tv. 
(Buckland Ad | (4), care pot fi colectate, accesate sau preluerate (Floridi 2002 [9]). 


Se panes robienia a Moi de adevăr a infortmaţiei. Care este situaţia 
entităților care sunt privite drept informaţie dar care în fapt nu conţin valoare de 
adevăr. Unii autori consideră că informaţia falsă este pseudo-informatie 
(Floridi 2002 [9]). Alţi autori sunt şi mai categorici: „informaţia falsă nu este un tip 
inferior de informatie; ea pur şi simplu nu este informatie” (Grice 1989 [11]); 
„informaţia falsă sau informaţia greşită nu sunt tipuri de informatie” 
(Dretske 1981 [8]). 


Pornind de la cele subliniate mai sus şi pe baza abordării metodologice 
dezvoltate în logica situationala de Barwise şi Perry 1983 [2]; Israel şi Perry 1990 
[14]; Devlin 1991 [7], Luciano Floridi 2002 [9] dă următoarea definiţie semantică 
pentru elementul individual de informaţie: 


o este informaţie obiectivă, semantică dacă şi numai dacă: 


e o constă într-un set D nevid de date (d); 
e datele din D sunt bine formatate; 

e datele din D au semnificatie; 

e datele d din D sunt veridice. 
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S-a utilizat termenul „veridic? în loc de „adevărat? cu sensul de 
„reprezentând sau transmițând un conţinut cu grad de adevăr despre o situație dată”. 
Toate discuţiile ulterioare şi referirile la noţiunea de informatie din această lucrare tin 
cont de această definiţie. 


Informaţia reprezintă un element fundamental al activității în orice 
întreprindere (Păunescu et al. 1985 [24]). Ea prezintă caracteristici similare celor pe 
care le au bunurile materiale: se produce, se stochează şi se prelucrează, este 
perisabilă în timp şi are un pret de cost — exprimat prin suma cheltuielilor ocazionate 
de obținerea, prelucrarea, memorarea sau difuzarea ei. 


Indicii de calitate ai informației sunt: precizia, oportunitatea, completitudinea. 


Precizia este definită prin cantitatea de informație corectă în raport cu 
întregul volum de informaţii produs într-o anumită perioadă de timp. Există un raport 
direct între acest indice de calitate şi datele pe care se fundamentează informaţiile 
respective; pentru a creşte valoarea acestui indice este necesar un volum mai mare de 
date. În acelaşi timp însă obţinerea informaţiilor dintr-o cantitate mare de date impune 
un volum mai mare de prelucrări care, în anumite situații, poate veni în contradicție 
cu alt indice de calitate şi anume cu oportunitatea. 


Relevanta sau actualitatea exprimă faptul că o informatie este utilă într-un 
anumit moment, legat de desfăşurarea în timp a unor fenomene. Obţinerea 
informaţiilor, care privesc aceste fenomene, după depăşirea unor etape ale evoluţiei 
lor reduc sau anulează valoarea acestor informaţii. Corelat cu precizia apare o 
anumită contradicție, a cărei soluționare depinde de natura şi specificul activității în 
cauză. Fenomenul de perisabilitate in timp ia -mformaţiilor se face simţit prin 
diminuarea valorii informaţiei în raport cu pretutde “Obtinere al acestora. 


Completitudinea exprimă necesitatea de a dispune de cât mai multe sau chiar 
de totalitatea informaţiilor referitoare la un domeniu al activităţii umane. 


Obţinerea informaţiilor cu calitățile menţionate anterior este condiționată atât 
de datele care le generează, cât şi de mijloacele de prelucrare disponibile. Dacă datele 
folosite în procesul de obţinere a informațiilor sunt inexacte, incomplete sau perimate, 
informaţiile care rezultă sunt de valoare redusă. Orice informaţie trebuie să reducă din 
incertitudine şi să conducă la o mai bună înţelegere a anumitor situații sau fenomene. 


Potrivit lui Zadeh (1997 [34]) informaţiile disponibile se pot grupa în trei 
categorii: 


e Informaţii factice care sunt numerice şi bazate pe măsurători (ex. „înălțimea 
grinzii este de 82,5 cm”); 

e Informaţii pseudo-numerice şi bazate pe pseudo-măsurători (ex. „ne întâlnim 
la trei”); 

e Informaţii bazate pe percepții care sunt în special aprecieri lingvistice (ex. 
„cineva este cinstit şi arătos”). 
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Aceste grupe diferă între ele prin gradul de incertitudine. 


Când există incertitudine în aprecierea unui fenomen se poate defini 
cantitatea de informaţie care înlătură această incertitudine. Informaţia este în acest caz 
numită şi entropie şi este reprezentată de numărul minim de întrebări ce trebuie pus în 
medie pentru a elimina incertitudinea. 


Numeric, informaţia poate fi estimată cantitativ funcție de probabilitatea 
stărilor. Astfel, considerând un număr de stări: x,,x,,...,x, a căror probabilitate de 


apariţie este dată de P(x, ), cantitatea de informatie se calculează cu formula: 


= oe )log, P (x;) (1) 


Logaritmul în baza doi implică măsurarea informaţiei în biti. Trebuie făcută 
convenţia Olog,(0)=0, adica o stare cu probabilitatea 0 nu aduce informatie in 


sistem. Se poate observa că şi existenţa unei stări cu probabilitate 1 conduce la 
informatie 0. 


CUNOSTINTELE 


Informatiile constituie baza rationamentelor, experimentarilor imaginate de 
mintea umană, in scopul obţinerii de noi cunoştinţe. 


Cunostintele reprezintă esenţa ce rezidă în spatele datelor şi informatilor într- 
un domeniu de activitate. Cunostintele se obţin prin cercetare ştiinţifică şi sunt un 
rezultat al sintezei procesării datelor, informaţiilor şi experienţei. 


Cunostintele acumulate facilitează aprecierea relaţiilor dintre atributele unui 
element, obiect, sistem, proces. Relaţiile pot fi: procedurale, temporale, structurale, 
spaţiale, logice, semantice, etc. Pe baza înţelegerii relaţiilor se poate lua o decizie într- 
un context dat. 


Capacitatea de a lua decizii corecte este influenţată de disponibilitatea datelor 
şi de aptitudinea de a anticipa consecinţele acțiunii. Capacitatea de a prezice într-un 
mod raţional consecinţele lucrărilor de intervenţie constituie cunoştinţa în domeniul 
managementului patrimoniului: cu cât este mai bogat corpul cunoştinţelor cu atât este 
mai puternic instrumentul de administrare; cu cât mai mare numărul de opțiuni cu atât 
decizia va avea o acuratețe mai ridicată. 


Analiza mai multor variante şi managementul bazat pe cunoştinţe este 
alegerea logică şi totuşi prea puţine persoane sau compartimente de planificare 
efectuează analize explicite şi complete. Chiar şi atunci când se consideră mai multe 
opţiuni, judecata este superficială şi se opreşte după câţiva paşi. Procesul decizional 
este prezentat în figura următoare. 
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Colectareadatelot | O sie l 
Soluţii alternative 


- Selecție - 
Luarea deciziilor 


Mediul fizic, social, politic, ştiinţific 


Cunoştinţe. — þ------------- 


Fig. 2 Procesul decizional (după [26]) 


--» 


Există două cauze pentru care oamenii nu iau decizii bazate pe cunoştinţe: (1) 
deficiență în cunoaştere şi (2) comportament inadecvat. 


1. pentru a utiliza cunoştinţele este necesar ca acestea să existe, să fie 
disponibile şi să fie incluse în instructia personalului; 
2. interese personale sau de grup, inertia sau indiferența pot perturba procesul de 
decizie. A 
Pornind de la cele prezentate mai sus este necesară cercetare ştiinţifică pentru 
a furniza administratorului metode extinse de colectare şi interpretare a datelor, 
modele corespunzătoare şi algoritmi decizionali eficienți. Opțiunile trebuie 


organizate, clasificate şi corect evaluate. 


1.4. VALOAREA DATELOR, INFORMAȚIILOR ŞI CUNOŞTINŢELOR 


Într-o lume cu magistrale informaţionale datele, informaţiile şi cunoştinţele 
au devenit mărfuri a căror comercializare cere sau se bazează pe metode de evaluare 
(Mowshowitz 1994 [20]). 
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In acest sens unii autori sunt extrem de categorici: 


„Pentru a fi informaţie, informaţia trebuie să aibă o valoare, trebuie să poată 
fi utilizată în procesul decizional şi să fie proiectată să conducă la o acţiune... Ea 
trebuie să reducă incertitudinea celor care o obțin” (Machlup şi Mansfield 1983 [18], 
citat de Meadow şi Yuan, 1997 [19]). 


Există mai multe raţiuni privind studierea valorii datelor, informaţiilor şi 
cunoştinţelor: 


Motivația educativ-instructiva — studierea valorii poate conduce la 
identificarea acelor entităţi care trebuie luate în consideraţie în procesul de 
administrație fie prin utilizarea de către persoanele fizice implicate, fie 
prin includerea lor în sisteme automate, informatizate de luare a deciziei. 


Motivația metodologică — metodele de evaluare a valorii informaţiei şi 
cunoştinţelor ajută la evaluarea sistemelor decizionale stabilite în urma 
cercetării sau experienţei practice. Selecția între diferite tipuri de sisteme 
de inteligență artificială utilizate în rezolvarea problemelor se poate face 
prin măsurarea valorii cunoştinţelor utilizate, generate şi manipulate. 


Motivația organizatorică — se leagă de funcţionarea sistemelor complexe in 
medii integrate, fie ele instituționale sau artificiale. Când mai multe 
module/compartimente sunt în competiţie pentru rezolvarea unei sarcini, 
evaluarea cunoştinţelor poate face identificare celui mai potrivit. 


La nivelul actual, în administrarea infrastructurii transporturilor, deşi nu se 
recunoaşte, s-a făcut prea puţin pentru a stabili în mod ştiinţific detaliile legate de 
colectarea datelor anume: cantitatea, precizia, frecvenţa şi chiar scopul. Cele mai 
importante rămân însă timpul şi costul şi aici probabil s-a făcut cel mai puţin. Pe de 
altă parte, industria transporturilor are o dinamică deosebită. Elementele de detaliu 
care trebuie măsurate şi prelucrate se schimbă destul de des. Colectarea datelor devine 
astfel o ţintă în continuă mişcare. 


Probabil că singurul domeniu care este reglementat din punctul de vedere al 
informaţiei şi unde datele se culeg în continuu, după proceduri bine stabilite, este 
industria transporturilor aeriene, dar şi aici erorile, omisiunile, imprecizia afectează 
procesul, rezultatele fiind uneori catastrofale. 


În domeniul administrării infrastructurii terestre s-au făcut paşi prea puţini şi 
prea mici ca importanţă în vederea stabilirii raportului cost-beneficiu în ceea ce 
priveşte colectarea datelor. Fiind un proces pe termen lung, factorii de decizie care 
investesc în programe de colectare a datelor investesc probabil în ceva din care ei nu 
obțin nici un beneficiu. Majoritatea datelor rămân moştenire succesorilor. De aceea, 
de multe ori, factorii politici nici nu iau în calcul proiecte care presupun culegerea de 
date, urmărirea comportamentului în timp etc. 
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Pentru prelucrarea datelor- şi- extragerea de informații semnificative sunt 
necesare programe statistice performante. Acestea au în general preţuri mari, dar 
programele statistice de scară largă, care se pretează la prelucrarea datelor din 
infrastructura transporturilor, au costuri exorbitante. Fiind finanţate de la buget, 
majoritatea agenţiilor de administrare nu dispun de fondurile necesare pentru 
achiziționarea şi menţinerea unor asemenea programe. În plus, justificarea necesității 
cheltuielilor pentru colectarea datelor ori însăşi colectarea datelor este deficitară. De 
multe ori nu se argumentează relevanta datelor colectate şi implicaţiile cunoaşterii. 


S99 


Conceptul de ,,relevanta” şi măsurarea acesteia sunt deosebit de delicate. 
Tate-Glass ş.a. (2000 [30]) compară măsurarea relevantei cu statul la focul de tabără: 
prea departe de „flacăra” politică rişti să fii tratat cu răceală, o poziție prea apropiată 
prezintă riscul de a te arde din cauza cheltuielilor inutile. iai 


Fundamental în rezolvarea problemei este anticiparea necesarului de date. 
Proiectele de statistică în infrastructura transporturilor, ca şi în alte domenii, sunt 5% 
statistică şi 95% logistică, ele fiind exerciții complexe de organizare şi planificare. 
Elementul esențial este în mai mică măsură competența în analize statistice cât 
abilitatea de a anticipa politicile şi nevoile de planificare în viitor. 


Când problemele de planificare sau de strategie ajung la Ministerul 
Transporturilor spre studiu este deja prea târziu să începem colectarea de date. In 
planificări strategice trebuie să se lucreze cu acele date care sunt imediat disponibile. 


Atunci când datele sunt cerute, conform Tate-Glass (2000 [30]), profesioniștii 
informaţiei pot răspunde în: 


e trei minute, când datele sunt pe raft; 

e trei ore, dacă trebuie căutat prin baza de date sau dosare; 

e trei zile, când datele trebuie prelucrate; 

e trei săptămâni, dacă trebuie făcută ceva programare sau modificat programul; 
e trei luni, când este necesară prelucrarea completă a datelor; 

e trei ani, dacă este necesară colectarea de noi date. 


De aceea sunt necesare programe proactive de colectare a datelor care să vină 
în întâmpinarea viitoarelor analize de politici în transporturi. 


1.5. UTILIZAREA DATELOR 


Domeniul managementului infrastructurii rutiere este un domeniu intensiv în 
utilizarea datelor, informaţiilor şi cunoştinţelor. Date de teren, de structură, de 
materiale, de reţea, informaţii de evoluţie, despre origine destinaţie, cunoştinţe despre 
comportamentul agenților umani implicaţi în trafic, al vehiculelor şi echipamentelor. 
lată doar câteva elemente care trebuie tratate de administratorii infrastructurii 
transporturilor. 
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Pentru a avea la dispoziţie date, informaţii şi cunoştinţe corecte şi complete în 
timp util administratorii infrastructurii transporturilor trebuie să aibă în vedere 
următoarele acțiuni: 


e Identificarea necesităţilor de date; 

e Crearea unui sistem de reprezentare a datelor; 

e Implementarea şi evaluarea unui sistem de colectare a datelor; 

e Crearea şi administrarea unui sistem de stocare şi regăsire a datelor 

e Implementarea sistemului de transmitere a datelor; 

e Identificarea algoritmilor utili în mecanismul decizional; 

e Identificarea, implementarea şi evaluarea unor proceduri de prelucrare a 
datelor; 

e Analiza rezultatelor în conformitate cu scopul urmărit 

e Evaluarea sistemului de management a datelor. 


Lucrarea de faţă urmăreşte şi tratează aceşti paşi, sau cel puţin încearcă să o 
facă. Totodată se încearcă să se prezinte laolaltă noțiunile şi metodele de procesare 
necesare pentru dezvoltarea unui sistem integrat de management a infrastructurii. 
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w STRUCTURI DE DATE 


Rezolvarea problemelor cu ajutorul calculatorului presupune analiza, 
gruparea şi structurarea datelor pentru a obține eficiență maximă. Utilizarea 
structurilor de date este impusă pe de o parte de înțelegerea facilă a problemei şi pe de 
altă parte de necesitatea implementării practice a procedurilor de rezolvare a 
problemei pe maşinile fizice. 


Structurile de date reprezintă o cale sistematică de organizare şi accesare a 
datelor [36]. 


Reprezentarea datelor şi a structurilor de date depind în mare măsură de 
construcția calculatoarelor fizice şi de implementările limbajelor de programare. 
Totuşi pe majoritatea calculatoarelor şi în majoritatea limbajelor apar următoarele 
structuri de date: setul, articole (înregistrarea), tablouri, liste, urne (buckets), stive, 
cozi, arbori şi reţele. 


În prezenta lucrare suntem preocupați mai puţin de reprezentarea efectivă a 
datelor în memorie sau de tipurile implicite oferite de limbajul de programare. De 
aceea prima structură tratată este articolul sau înregistrarea. Aceasta este baza pentru 
toate celelalte reprezentări de tipuri de date abstracte. 


2.1. ARTICOLUL 


Articolul sau înregistrarea este o structură neomogenă reprezentând reuniunea 
unui număr fix de componente numite câmpuri care constituie logic o unitate. 
Câmpurile din structură sunt caracterizate prin tipul lor care poate fi unul primar, 
oferit de limbajul de programare, sau unul complex, definit de către proiectant (deci la 
rândul său un articol). Gruparea câmpurilor se face din considerente de procesare dar 
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în cele mai multe cazuri sunt grupate atribute comune ale unei entități care trebuie 
tratată. Lungimea totală a articolului este dată de suma lungimilor câmpurilor 


(L(A) = SL, ) (vezi Fig. 3). 


Articol A 
Camp 1 Tip câmp 1 L1 
Câmp_2 Tip_câmp_2 L2 
Câmp_3 Tip_câmp_3 L3 
Camp _i Tip camp i Li 
| Camp_n | Tip _ câmp n Ln 


Fig. 3 Structura unui articol 


Regăsirea câmpului se face cu ajutorul unui identificator asociat la definire. 
Pentru regăsirea unui câmp când există mai multe articole se utilizează numele 
articolului şi al câmpului împreună. 


Implementările moderne ale obiectelor pot genera articole cu structură 
variabilă. Chiar dacă unele dintre variante au lungimi diferite, articolul în ansamblu 
va avea lungimea celei mai lungi dintre variante şi aceasta este cantitatea de memorie 
care va fi rezervată de fiecare dată când se creează un nou articol. 


2.2. TIPURI ABSTRACTE DE DATE 


O categorie specială de structură de date derivată din articol este obiectul. Un 
obiect, denumit în unele implementări recente clasă, încapsulează într-o structură 
unică atât datele cât şi un set de proceduri şi funcţii care efectuează prelucrarea de 
bază a datelor respective. Astfel de proceduri, ataşate în momentul definirii, elimină 
ambiguitatea şi oferă siguranța că prelucrarea şi rezultatele obținute se referă strict la 
setul de date conţinut de obiect. 


Procedurile definite în interiorul obiectului ajută proiectantul să nu se mai 
gândească la procesul complicat de referire a câmpurilor şi regăsire a datelor care 
apare când acestea sunt căutate din exterior. Modalitatile efective de definire a 
obiectelor şi a procedurilor şi funcţiilor ataşate depind de limbajul de programare ales. 
Definirea unor noi obiecte se poate face pe baza unora deja existente. Noile obiecte 
moştenesc structura de date şi proprietăţile de la cele anterioare. Ele pot defini noi 
elemente sau le pot modifica pe cele anterioare. 


Încapsularea componentelor şi moştenirea permit un anumit grad de 
abstractizare a datelor (a abstractiza cu sensul de a distila un sistem complicat până 
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la conceptele sale fundamentale). Aceasta implică identificarea componentelor şi 
descrierea functionalitatii lor. Datele sunt organizate modular şi există posibilitatea ca 
detaliile interne de ithplementare să fie „ascunse” utilizatorilor, iar comunicarea să se 
facă numai prin acea parte a datelor şi funcţiilor care sunt declarate publice. Se obţine 
astfel un grad ridicat de libertate pentru analişti şi programatori. 


Aplicând paradigma abstractizării la proiectarea structurilor de date obținem 
tipuri abstracte de date - TAD. 


Tipul abstract de date este un model matematic prin care se definesc tipurile 
de date ce pot fi stocate într-o structură şi metodele disponibile să proceseze datele. 
Se defineşte deci o interfață. Interfața este un „contract” prin care ni se garantează 
disponibilitatea unor elemente, fără să ni se ofere detalii privind implementarea 
internă [36]. 


Tip Abstract de Date = Interfaţă + Implementare (2) 


Interfața defineşte proprietățile logice ale TAD şi în special profilul sau 
semnătura operaţiilor sale. 


Implementarea defineşte reprezentarea structurii de date şi algoritmii de 
implementare a operaţiilor. 


I 
Un TAD este realizat printr-un pachet, cel-mai adesea un pachet generic. 
Particularizările se fac prin definirea de descendenţi care preiau (moştenesc) 
caracteristicile tipului initial. 


Specificatiile pachetului sunt reprezentate de interfață. Structura de date este 
declarată ca o zonă privată. Operatiile sunt declarate sub forma unor subprograme ce 
au cel putin un parametru. 


Partea privată a specificaţiilor şi a corpului pachetului reprezintă 
implementarea TAD. Tot aici este inclusă şi reprezentarea structurii de date. 


Exemple de tipuri de operatori [48]: 


e Constructori — crearea şi initializarea unui obiect. 

e Selectori — furnizează informaţii despre starea obiectului. 

e Modificatori — alterează starea unui obiect. 

e Destructor — distruge obiectul. 

e Iteratori (engl. iterators; franc. parcoureurs, iterateurs) — accesează toate 
părțile unui obiect compus şi aplică o anumită acțiune fiecăruia dintre ele. 


Studiu de caz 


Un exemplu de limbaj de programare ce permite declararea şi lucrul cu tipuri 
abstracte de date este şi dialectul de Pascal al mediului de programare Delphi 
dezvoltat de Borland. 
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type 

TNewObject = class (TOldObject) 
private 

{ Private declarations } 
protected 

{ Protected declarations } 
public 

{ Public declarations } 
end; 


Fig. 4 Declararea claselor în Delphi Pascal 


Un membru (element) privat (engl. private) este invizibil în afara unității de 
programare sau modulului în care clasa a fost declarată. Prin plasarea declaraţiilor 
claselor legate între ele în acelaşi modul puteţi să oferiţi claselor acces una la 
resursele alteia fără ca elementele respective să fie „văzute” din afară de alte clase sau 
proceduri. 


Un membru protejat (engl. protected) este vizibil în modulul în care clasa a 
fost declarată şi în oricare clasă descendentă, indiferent de modulul în care aceasta 
apare. Se intenţionează ca aceste elemente să fie caracteristici generale pentru toți 
descendenții. 


Un membru public este vizibil oriunde clasa este vizibilă şi poate fi referită. 


Un membru publicat (engl. published) are aceeaşi vizibilitate ca orice 
membru public. Diferenţa constă în faptul că pentru aceste elemente se generează 
informaţii suplimentare pe timpul rulării (RTTI — runtime type information). Prin 
aceasta se pot asocia metode specifice cu proprietăţi specifice (de ex. proceduri de 
tratarea evenimentelor cu evenimente particulare). 


2.3. SETUL 


Setul sau mulțimea reprezintă o colecţie finită de elemente 
M = {m,,m,,...,m,}. Deoarece, prin definitie, este finit, setul poate fi imaginat ca un 
vector. Deoarece componenţa sa este aprioric definită şi cunoscută, reprezentarea ca 
vector de tipul (m,,m,,...,m, ) nu ar aduce informatii relevante. Este mult mai 


important să reprezentăm un sub-set S ce poate fi definit pe mulţimea inițială. 
Pentru aceasta vom defini o funcţie de apartenență A: M — {0,1}, astfel: 


a; = A(m,)= 


1, când m, e S 
(3) 


0,candm, £ S 


Acum sub-setul poate fi reprezentat prin vectorul valorilor funcției de 
apartenenţă v, = (îsi); 


17 


Capitolul 2 — Structuri de date 


Operatiile ce trebuie să fie create pe un sub-set sunt: 
e Inserare, pentru a introduce un element in sub-set [Insert(e,S) >eeS¢]; 
e Eliminare, care scoate elementul din sub-set [Suppress(e,S) >eg S]; 
e Apartine, functie care face cunoscut apartenenta unui element la sub-set; 
e Vid, indică faptul că sub-setul nu conţine nici-un element; 


e Alte operaţii ce se pot defini sunt: 
e complementul, 


e reuniunea, 

e intersecția, 

e diferența, 

e diferența simetrică. 
2.4. TABLOUL 


Tabloul reprezintă, în esență, o mulțime de date de acelaşi tip care se 
grupează în poziţii succesive în aşa fel încât să poată fi regăsite prin utilizarea unor 
indici de poziţie. 


Astfel aplicaţia: 


f :4{1,2,-++,7 }x 02 7) xx (12,50, >M (4) 


care ataşează fiecărui k-uplu de indici (îi) un element 


m 7 eM defineşte un tablou k-dimensional. Pentru cazul particular k =1 se 


iy sig gy, 
obtine un vector. Reprezentarea fizica a tablourilor se face prin rezervarea de locatii 
succesive intr-o zona contigua de memorie. 


Identificarea unui anumit element din tablou se face prin numele tabloului şi 
setul de indici corespunzători elementului. Aşa cum spuneam la început tabloul se 
regăseşte ca o structură omogenă şi oricare dintre operațiile definite se aplică oricărui 
element din tablou. Pe astfel de structuri se pot lesne aplica proceduri repetitive. 
Implementările moderne ale tablourilor permit definirea unor seturi de indici care nu 
pornesc obligatoriu de la 1 sau 0, lucru ce dă mai multă flexibilitate în programare. 


Elementele din tablou pot fi de tip simplu oferite de către limbajul de 
programare (întregi, reali, şiruri de caractere etc.) dar şi tipuri complexe definite de 
către utilizator (ex. articole, obiecte etc.). 


În principiu, lungimea unui tablou este fixă şi deci numărul de elemente este 
constant. În general, pentru a simula un număr variabil de elemente se contorizează 
într-o variabilă externă numărul de elemente ocupate sau se utilizează tablouri de 
pointeri pentru care se alocă ulterior articole sau obiecte. 
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2.5. LISTA INLANTUITA 


Lista este o structură de date care are lungime variabilă. In multe cazuri, nu se 
poate cunoaşte din momentul proiectării programului care va fi numărul exact al 
elementelor utilizate în calcul. 


Alocarea unui anumit spațiu fixat în faza de programare poate conduce la 
două situaţii neplăcute: fie se alocă spaţiu insuficient şi problema rămâne nerezolvată, 
fie se alocă prea mult spaţiu care rămâne neutilizat şi se consumă inutil din resursele 
calculatorului blocând celelalte programe. Soluția propusă a fost de a aloca dinamic 
memorie pe măsură ce nevoia o impune. În structura artivoletar, pe langa informatia 
utilă, se păstrează referinţe către alte articole similare cate pot- fi create pe măsură ce 
programul este rulat. Se creează astfel o inlantuire care are o lungime variabilă, 
programul utilizând atâta memorie cât este necesară. 


Referinţe 


Date de calcul (date de legătură) 


Fig. 5 Structura unui obiect dintr-o listă 


Inlantuirea de articole similare care contin referințe unul despre altul păstrând 
un singur nivel de legături se numeşte listă (Fig. 6). 


BAZA 


I A E 


DATI |REF_1 DAT2 |REF 2] ------—- DAT N-1 REF N-I DATN | NIL 


Fig. 6 Înlănțuirea în listă 


Lista este accesată din interiorul programului prin intermediul unei adrese de 
bază (o referință, un pointer etc.), elementul din listă care este referit fiind capul de 
listă. Se observă că datele referinţă din ultimul element din listă sunt vide (NIL), 
acesta fiind unul dintre indicatorii de terminare a inlantuirii. 


Din punct de vedere matematic, lista reprezintă o secvență de zero sau mai 
multe elemente de un anumit tip dat. Numărul n de elemente ce se regăsesc în listă 
reprezintă lungimea listei. Când lungimea este 0 adresa de bază este vidă (NIL). 


Elementele pot fi identificate prin poziţia lor în listă. Din considerente ce tin 
de reprezentarea numerelor întregi în formatul binar este uzual a se spune că primul 
element ocupă poziţia 0. 


Dacă ultimul element conține o referință către capul de listă avem o listă 
circulară. Inlantuirea poate fi simplă, dar se poate ca fiecare element să conţină 
referinţe atât către succesor cât şi către predecesor. In acest caz inlantuirea este dublă. 
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BAZA 
~~ 


DAT 1 NIL refU_1 DAT 1 |refA_I}refU_I] -------- DATN [refA N| NIL 


Fig. 7 Listă cu inlantuire dublă 


Posibilitatea creării de liste şi, în general, proprietăţile pe care au fost 
identificate pentru articole se păstrează şi pentru obiecte. 


Pe liste se pot defini unele operaţiuni: 


e Adauga(x,L) / Add(x,L). Adaugă elementul x la lista L. Poziţia va fi la coada 
listei. Lungimea listei se incrementează. 

e Introduce(x,p,L) / Insert(x,p,L). Include elementul x în cadrul listei L în 
poziţia p. 

e Cauta(x,L) / Find(x,L). Returnează poziția elementului x în lista L. Dacă x nu 
este inclus în listă atunci rezultatul este sfârşitul listei. Dacă x este inclus 
mai mult decât o singură dată atunci prima apariție întâlnită este întoarsă ca 
rezultat. 

e Element(p,L) / Retrive(p,L). Returnează elementul aflat pe poziţia p în lista 
L. Rezultatul este nedefinit (Nul) dacă p este mai mare sau egal cu 
lungimea listei. Tipul rezultatului este tipul elementului este acelaşi cu tipul 
definit pentru elementele listei. 

e Elimină(p,L) / Delete(p,L). Şterge elementul din poziţia p din lista L. 
Operația afectează doar lista, elementul rămâne în memorie şi poate fi 
accesat dacă este referit prin alte metode (de ex. mai este inclus într-o altă 
listă). Operația trebuie utilizată cu atenţie pentru a nu lăsa obiecte fără cale 
de acces. 

e Prim(L) / First(L). Întoarce poziția primului element din lista L. Permite 
utilizarea operației Următor (engl. Next). 

e Ultim(L) / Last(L). Întoarce poziția ultimului element din listă. 

e Urmator(L) / Next(L). Întoarce poziţia elementului din lista L care urmează 
după elementul selectat. Dacă în listă există mai puţin de două elemente 
sau elementul selectat este ultimul din listă atunci rezultatul este nedefinit. 

e Anterior(L) / Preview(L). Întoarce poziţia elementului din lista L care se 
situează înaintea elementului selectat. Dacă în listă există mai puţin de 
două elemente sau elementul selectat este primul din listă atunci rezultatul 
este nedefinit. 

e Sterge(L) / Clear(L). Asemănător cu eliminarea dar pe lângă ştergerea 
referirii din listă se încheie şi existența obiectului. După această operaţie 
obiectul nu mai poate fi accesat. Atenţie: dacă obiectul mai era referit prin 
alte mecanisme (de ex. era inclus în altă listă) apelarea va genera erori 
fatale. 
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Mai jos prezentăm câteva exemple de implementări de operații pe liste. 


Proc Inser( x : DataType, L: ListType ) 
x.Next <- head 
If head<>Nil then Head.Prev <- x 
Head <- x 
x.preview <- Nil 

EndProc 


Fig. 8 Implementarea funcției de inserarea 


În Fig. 6 s-a prezentat o operaţie de inserare. S-a presupus implicit că 
inserarea se face în capul listei (prima poziţie). 


Corespunzător operaţiei de adăugare, s-a creat şi operaţia de eliminare. În 
figura următoare prezentăm un exemplu de implementare. 


Proc Delete( x : DataType, L: ListType ) 


If x.preview # Nil 


Then x.preview.next « x.next 
Else L.Head - x.next 
EndIf 
If x.Next # Nil 
Then x.Next.Preview « x.Preview 
EndIf 
EndProc 


Fig. 9 Ştergerea unui element dintr-o listă inlantuita 


2.6. URNE 


Urnele sau grămezile (literatura de limbă engleză utilizează termenul de 
bucket) reprezintă o grupare de date a căror ordine de utilizare nu prezintă importanță. 


2.7. TABELE DE DISPERSIE (HASH TABLES) 


Tabelele de dispersie (hash tables) reprezintă o metodă eficientă de 
implementare a dictionarelor. Pentru căutare ele asigură o complexitate O(1) in medie 


Şi O(n) in cazul cel mai defavorabil [37], [43]. 
În practică, tabelele de dispersie sunt simpli vectori adresati de o funcţie de 


repartiție. Fiecare celulă a vectorului conţine o referință (pointer) către o lista 
inlantuita în care se plasează elementele dicționarului. 
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Prezentăm în continuare un exemplu de tabelă de dispersie cu dimensiunea 5. 


[ 20 | t | lo 
“| Dy OP] mal) Bw 3 
«| Par 


hl Qin]; =| > 


“| lo <| [x 7 


Fig. 10 Tabelă de dispersie 


Cazul cel mai defavorabil este dat de situarea tuturor elementelor într-o 
singură listă inlantuita. 


Un asemenea caz este dat sau evitat de forma funcției de repartiție. Dacă 
funcția de repartiție este uniformă atunci lista inițială se subdivide în părți 
aproximativ egale. Pentru aceasta se utilizează diverse tipuri de funcții: 


e Restul împărțirii la M (operația modulo M). Cheia considerată pentru fiecare 
element se împarte la dimensiunea tabelei. Restul rezultat se utilizează ca 
index pentru poziționarea în tabelă. 

e Se alege M să fie număr prim. Se asigură o uniformitate mai bună. 


O tabelă de dispersie, ca structură de stocare a datelor are un constructor şi 
trei metode: 


e Creare / Init creează tabela şi initializeaza câmpurile la valoarea implicită; 

e Inserează(M) / Insert(M) calculează indexul i =index(M) cu ajutorul 
funcţiei de dispersie şi introduce elementul in lista adresată de poziţia i din 
tabelă; 

e Caută(M) / Find(M) calculează indexul i =index(M) cu ajutorul funcției 
de dispersie şi caută elementul în lista adresată de poziţia i din tabelă; dacă 
nu este găsit se returnează Nil sau se generează o eroare; 

e Elimină(M) / Remove(M) calculează indexul i =index(M) cu ajutorul 
funcţiei de dispersie, caută elementul în lista adresată de poziția i din 
tabelă şi elimină obiectul; dacă nu este găsit se returnează Nil sau se 
generează o eroare; 


2.8. STIVE 


Stivele reprezintă structuri de date care au o singură cale de acces atât pentru 
introducere cât şi pentru extragere de date: vârful stivei. Pentru ele se alocă inițial o 
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zonă statică, fixă a cărei conţinut este vid (numărul de elemente este 0). Pe măsură ce 
noi date trebuie păstrate ele se depun în stivă numărul elementelor fiind incrementat 
(Fig. 11). Când se doreşte utilizarea datelor salvate singura modalitate de acces 
permisă este scoaterea elementului din stivă (cu decrementarea numărului de 
elemente) (Fig. 12). 


N 


Element nou 


L+ 


a) b) 
Fig. 1] Stiva înainte şi după introducerea unui element 


( 


Element ce se elimină 


a) b) 
Fig. 12 Stiva înainte şi după extragerea unui element 


Modul de lucru al acestor structuri este ultimul intrat — primul ieşit LIFO (last 
in - first out). Pentru o corectă funcționare, în general, se alocă un tablou cu elemente 
de tipul cerut şi o variabilă în care se păstrează un indicator de stivă. Valoarea 0 a 
indicatorului semnalizează stiva goală. Valoarea indicatorului egală cu lungimea 
stivei semnalizează stiva plină. Verificarea acestor două stări cade în sarcina 
programatorului înainte de a efectua extragerea şi respectiv depunerea. 


La adăugarea unui nou element valoarea indicatorului creşte cu unu 
(L <— L+1) în timp ce la scoaterea unui element valoarea indicatorului de stivă 
descreşte cu unu(L< L-1). 
Pe o asemenea structură se pot defini următoarele operaţii minimale: 
e Sterge(S) / Clear(S): elimină toate datele din stivă şi aduce indicatorul în 
poziţia inițială. 
e Adauga(x,S) / Push(S): introduce elementul x în vârful stivei. Indicatorul este 
incrementat. Dacă stiva este deja plină generează o eroare. 
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e Extrage(S) / Pop(S): extrage elementul din vârful stivei şi îl întoarce ca 
rezultat. Indicatorul este decrementat corespunzător. Dacă stiva este goală 
generează un mesaj şi se returnează elementul vid. 

e Varful(S) / Top(S): verifică elementul din vârful stivei fără a-l îndepărta. 

e Este Vida(S) / IsEmpty(S): verifică dacă stiva este goală şi întoarce valoarea 
logică (booleană) corespunzătoare. 


O implementare facilă a stivei pentru tipuri complexe de articole se poate 
realiza prin utilizarea unei liste inlantuite. Descrierea în limbaj pseudocod se face in 
figura următoare (Fig. 13). 


DecType DataType As Record 
EndRecord 
DecType LinkedRecord As Record 
Data : DataType 
Next : “LinkedRecord 
EndRecord 
Declare Heap As LinkedRecord 
Proc Push( x : DataType ) 
tmp <- new LinkedRecord 
tmp.data <- x 
tmp.next <- Heap 
Heap <- tmp 
EndProc 
Function Pop(): 
If IsEmpty() then Error 
tmp <- top 
top <- top.next 
tmpX <- tmp.data 
Delete tmp 
Return tmpX 
EndFunct 
Funct IsEmpty () 
if Heap = Nil 
then Return TRUE 
else Return FALSI 
EndFunct 


GI 


Fig. 13 Operatiile pentru stiva implementată prin lista inlantuita 


2.9. COZI 


Coada reprezintă o structură de date în care accesul se realizează pe două căi: 
una de intrare şi una de ieşire. Atunci când coada nu este vidă, elementele sunt 
disponibile la ieşire în ordinea în care au fost depuse. Modul de lucru al cozilor este 
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primul intrat — primul ieşit FIFO (first in - first out). Reprezentarea intuitivă a 
modului de lucru este prezentată în Fig. 14 şi Fig. 15. 


x 


Element nou 


L+1 


a) 


b) 


Fig. 14 Coada înainte şi după introducerea unui element 


L-1 


Element çe se elimină Ta 


a) 


> 


b) 


Fig. 15 Coada inainte si dupa extragerea unui element 


In fapt, pentru implementarea unei cozi se poate utiliza tot un tablou care se 
alocă cu o lungime fixă de n elemente şi două variabile care păstrează doi indicatori: 
unul privind sfârşitul cozii (Ja) şi unul pentru vârful cozii (Je) (vezi Fig. 16). 


—_ 


Element ce se adaugă 


Elementyce se elimina 


a 


Y 


Fig. 16 Implementarea practică a cozilor 


Presupunând /a şi Je indici în tablou, utilizăm /a pentru adăugare şi Je pentru 
extragere. După adăugarea unui nou element se incrementează Ja (la < la +1). 
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Dacă Ja depăşeşte dimensiunea tabloului Ja ia valoarea bazei tabloului (pentru 
simplitate să presupunem 0). Când se extrage un element se incrementează le 
(Je < le+1) şi, în mod similar, dacă Je depăşeşte dimensiunea tabloului atunci ia 
valoare bazei tabloului. Dacă /a=/e atunci coada este vidă, dacă 
Ie < (Ia + 1) mod n) atunci coada este plină. Este datoria programatorului să facă 
verificarea înainte de fiecare extragere şi adăugare respectiv. 


Pentru cozi se pot defini următoarele operaţii minimale: 


e Sterge(Q) / Clear(Q): elimină toate datele din coadă şi aduce indicatorii Ia şi 
le în poziţia iniţială. 

e Adauga(x,Q) / Enqueue(x,Q): Introduce elementul x la sfârşitul cozii. 
Indicatorul Ia este incrementat. Când coada este deja plină generează o 
eroare fără să mai adauge elementul. 

e Extrage(Q) / Dequeue(Q): extrage elementul din vârful cozii şi îl întoarce ca 
rezultat. Indicatorul Ie este incrementat corespunzător. Dacă coada este 
goală generează un mesaj şi se returnează elementul vid. 

e Varful(Q) / Top(Q): verifică următorul element din coadă fără a-l îndepărta. 

e Este Vida(Q) / IsEmpty(Q): verifică dacă coada este goală şi întoarce valoarea 
logică (booleană) corespunzătoare. 

e EstePlina(Q) / IsFull(Q): verifică dacă coada este goală şi întoarce valoarea 
logică (booleană) corespunzătoare. 


Operatiile de mai sus pot fi simplu descrise utilizând limbajul pseudocod. 
Prezentăm mai jos câteva dintre funcții pentru implementarea cu ajutorul tabloului. 


Declare Q As array of OType 
Declare Ia, Ie As Integer 
Proc Enqueue (x) 

Ia <-(Iat+l) mod N 

Q[Ia] <- x 

EndProc 
Funct Dequeue () 
Ie <-(Ierl) mod N 
Return Q[Ie] 
EndFunct 
Funct IsEmpty () 

If Ie = Ia 
then Return TRUE 
else Return FALSE 

EndFunct 
Funct IsFull () 

If (Ia+1) mod N = I 
then Return TRUE 
else Return FALS 

EndFunct 


Fig. 17 Operatiile pentru o coadă implementată printr-un tablou 
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Reprezentarea cozii prin liste inlantuite: 


DecType DataType As Record 
EndRecord 
DecType LinkedRecord As Record 
Data : DataType 
Next : “LinkedRecord 
EndRecord 
DecType Queue As Record 
Head, Tail: “LinkedRecord 
EndRecord 
Declare Q As “Queue 
Funct IsEmpty( Q ) 
If Q = Nil 
Then return True 
Else Return False 
EndFunct 
Proc enqueue (Q, x) 
tmp « new LinkedRecord 
tmp.data « x 
tmp.next < Nil 
If Q.Head = Nil 
Then Q.Head <- tmp 
Else (Q.Tail).Next - p 
Q.Tail —p 
EndProc 
Funct dequeue( Q ) 
If IsEmpty(Q) then Error 


Tmp « Q.Head 
Tmpx - Tmp.Data 
Q.Head - Tmp.Next 
If Q.Head = Nil Then Q.Tail < Nil 
Free Tmp 
Return TmpX 
EndFunct 


Fig. 18 Reprezentarea cozilor prin liste inlantuite 


2.10. ARBORI 


Considerăm o mulţime finită de elemente (fie ele articole sau obiecte) pe care 
le vom denumi noduri. Această mulțime se va numi arbore dacă : 


e există un nod special denumit rădăcină; 
e celelalte noduri sunt grupate în submultimi care la rândul lor sunt arbori. 


Elementele arborelui sunt nodurile şi legăturile care se stabilesc între acestea. 


27 


Capitolul 2 — Structuri de date 


Ni 
Nii si Niji ee Nini 


e| Niji || Nijinji 


Fig. 19 Arbore 


Rădăcina constituie nivelul 0 şi are referiri către un număr de noduri care 
constituie nivelul 1, fiecare dintre nodurile acestui nivel au referiri către nodurile unui 
al doilea şi aşa mai departe. Fiecare nod este direct subordonat doar unui singur alt 
nod. Orice nod este părinte pentru subordonații săi care, la rândul lor sunt 
descendenţi pentru acesta. Orice nod fără descendenţi este nod terminal sau frunză. 


Înălțimea (sau adâncimea) unui arbore este dată de numărul de niveluri 
ierarhice prezente. 


Structura de date trebuie deci să conţină pe lângă datele utile şi referinţe către 
toți descendenții şi eventual către părinte. 


Date de calcul Părinte] REF 1| REF 2| ... | REF n 


Fig. 20 Structura unui nod dintr-un arbore 


Mai sus prezentăm schematic structura unui nod al unui arbore. Referințele 
către părinte nu sunt obligatorii. Nu se fac referiri către noduri cuprinse în alti sub- 
arbori ai aceluiaşi arbore. Dacă există descendenţi sau nu există suficienţi care să 
completeze spaţiul lăsat pentru referinţe, locaţiile excedentare se completează cu NIL 
(entitatea care identifică lista vidă). Dacă referința PĂRINTE există şi este egală cu 
NIL avem de-a face cu rădăcina. 


ARBORI BINARI 


Reprezintă o categorie specială de arbori. Fiecare dintre noduri are doar 
maxim doi descendenţi: un sub-arbore stânga şi un sub-arbore dreapta. Poziţia celor 
doi este foarte importantă spre deosebire de arborii normali la care ordinea fiilor nu 
contează şi era suficient să se cunoască cine este descendentul cui. 


Pentru arborii binari trebuie cunoscută atât descendența cât şi poziţia corectă. 
Cei doi sub-arbori nu sunt interschimbabili. 
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Structura de date a unui arbore binar este prezentă în figura următoare: 


Date de calcul Părinte| Stânga |Dreapta 


Fig. 21 Structura unui nod dintr-un arbore binar 


Dacă unul sau ambii descendenţi lipsesc locaţia se completează cu NIL. 


Arborii binari sunt foarte populari în implementarea mecanismelor de căutare 
a datelor ordonate. 


Câteva definiții se impun în acest context: 


Arbore strict binar — un arbore binar în care fiecare nod-care nu este frunză 
oe . 1 
are ambii descendenti; masei 


Arbore binar complet — arbore în care toate frunzele sunt la acelaşi nivel; 
Arbore binar de căutare — arbore binar care nodurile sunt ordonate pentru a 
facilita operația de căutare. 
Arbori binari de căutare 


Este un tip special de arbore binar în care datele sunt aranjate cu respectarea 
unor reguli. Presupunând că valoarea unui nod oarecare dintr-un arbore binar de 
căutare este m, următoarele proprietăți sunt întâlnite [37]: 


e Toate valorile mai mici decât m sunt în stânga, 
e Toate valorile mai mari decât m sunt în dreapta. 


Spre exemplu, dacă avem 7 numere ele vor fi aranjate într-un arbore binar de 
căutare astfel: 


Fig. 22 Reprezentarea datelor într-un arbore binar de căutare 
Înălţimea arborelui din exemplul precedent este 3. se poate observa faptul că 
dacă vom căuta o valoare în arbore vom găsi după maxim 3 paşi. 


Se poate observa că valorile sunt aşezate în mod regulat în aşa fel încât să se 
obțină un echilibru. Aceste echilibru menţine o eficiență maximă în utilizarea 
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arborelui de căutare. Spre deosebire de exemplul de mai sus în figura următoare avem 
reprezentat un arbore dezechilibrat. 


Fig. 23 Reprezentarea datelor într-un arbore dezechilibrat 


Acest arbore este binar de căutare, el respectând toate regulile impuse. Din 
nefericire toate valorile au fost depuse în descendenţii de pe un singur sens. Pentru 
doar cinci valori s-a obţinut o înălţime a arborelui de cinci ceea-ce-face căutarea 
ineficientă. 


Din aceste considerente s-a impus utilizarea altor tipuri de arbori. 


Arbori roşu-negru 


Sunt arbori binari de căutare în care se doreşte o balansare cât mai bună a 
datelor. Numele vine de la faptul că nodurile se colorează cu două culori: roşu şi 
negru. Aceste culori sunt atribuite după reguli care determină echilibrarea arborelui. 


Arborii roşu-negru au următoarele proprietăți [37]: 
e Fiecare nod este colorat sau în negru Săi în roşu; pei pi 
l 
e Orice frunză este un nod NIL şi se colorează în negru; ~~" 2 TTT 
e Dacă un nod este roşu atunci ambii descendenți sunt negri; 
e Orice cale simplă de la un nod la o frunză descendentă conține acelaşi număr 


de noduri negre. 


Numărul de noduri colorate în negru de pe o cale poartă numele de 
„adâncime neagră” sau „înălțime neagră”. 


ARBORI B 

Arborii B (Knuth 1998 [43], Cormen 1998 [37], Aho 1983 [35]) reprezintă o 
altă cale de implementare a unui mecanism de menţinere echilibrată a arborilor de 
căutare. El reprezintă o garantie a faptului că arborele va rămâne din construcție cu o 
înălțime mică. Acest tip de arbore se pretează la implementarea dictionarelor. 
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Un arbore B de ordin m este un arbore pozitional care are următoarele 
proprietăți: 


e Toate nodurile au cel mult m descendenţi; 

e Toate nodurile cu excepția rădăcinii au cel putin m/2 descendenți; 

e Un nod care are m descendenţi notati cu Do, Di, ... , Dm-1 are şi m-1 chei 
notate cu K;, Kə, ... , Km-1 cu proprietatea că K);<K>< ... <K m-1. 

e Pentru oricare nod cheia K; este mai mare decât toate cheile descendentului 
notat D;. dar este mai mică decât toate cheile descendentului D;. (cheile 
sunt situate între descendenți) 

e Toţi descendenții NIL sunt situaţi la acelaşi nivel al arborelui. 


SS 


| 2 4 5 7 8 11 12 14 | |16 
Fig. 24 Reprezentarea unui arbore B 
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BAZE DE DATE, 
PREZENTARE GENERALĂ 


3.1. ISTORICUL BAZELOR DE DATE 


Stocarea şi procesarea datelor nu este o invenţie şi o caracteristică a erei 
moderne. Din totdeauna omenirea a căutat să păstreze informaţiile pentru aducere 
aminte sau pentru posteritate. Iniţial pe scoarța copacilor şi pe pereţii peşterilor apoi 
pe tăblițe de lut, suluri de papirus, pergament, hârtie şi acum pe computere. Stocarea 
şi păstrarea sistematică a datelor, catalogarea, ordonarea şi regăsirea lor cu scopul 
prelucrării îşi are originea în vechile biblioteci şi arhive. Multe dintre principiile 
fundamentale ale bazelor de date au fost descoperite şi învăţate la acea vreme, 
ignorarea lor ducând la repetarea inutilă a unor greşeli de proiectare şi implementare. 


Când calculatoarele electronice au devenit accesibile publicului s-a pus 
problema utilizării lor pentru stocarea de date. În anii 1960 s-au depus eforturi pentru 
a standardiza acest proces şi au rezultat două modele: modelul reţea (CODASYL) şi 
modelul ierarhic (IMS). Accesul la date se făcea încă într-un mod greoi prin operaţii 
de nivel scăzut. Adăugarea unui nou câmp impunea modificarea schemei de acces 
deoarece predominantă era preocuparea pentru definirea înregistrărilor şi nu structura 
sistemului. Erau necesare cunoştinţe de structură internă pentru scrierea programelor. 


Cu toate aceste minusuri începutul era făcut şi procesul nu mai putea fi oprit. 
Astfel propunerea lui E.F. Codd din 1970 privind modelul relational al bazelor de 
date a venit firesc. El despartea în două probleme distincte descrierea bazelor de date: 
organizarea logică şi metodele de stocare fizică. 
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Imediat (anii 1974-1977) propunerea teoretică a lui Codd a fost implementată 
practic în principal în două sisteme: Ingres dezvoltat de UCB cu limbajul de 
interogare QUEL şi System R dezvoltat de IBM la San Jose cu limbajul SEQUEL. 


Următorul pas logic a fost dezvoltarea modelului Entitate-Relatie pentru 
proiectarea bazelor de date. Această nouă abordare permitea concentrarea asupra 
utilizării datelor. Această propunere a fost făcută de P.Chen în 1976. 


Combinând realizările anterioare Sequel 2 devine SQL şi în 1982 se începe 
standardizarea sa, proces încheiat în 1986. SQL devine un limbaj universal utilizat de 
foarte multe sisteme practice IBM DB2, RIM, RBASE 5000, PARADOX, OS/2 
Database Manager, Dbase III şi IV, Watcom SQL şi numărul este mult mai larg. 


După 1990 se merge pe dezvoltarea standardelor existente şi se pune un 
deosebit accent pe dezvoltarea de instrumente de acces la bazele de date. Direcțiile 
principale sunt: (1) posibilitatea de a crea programe utilizând limbajul de interogare şi 
(2) de a permite în limbaje de uz general includerea de comenzi de interogare. 
Totodată se începe definirea conceptului de sistemel de baze de date orientate pe 
obiect. 


Tot în aceeaşi perioadă se distinge preocuparea creării de baze de date 
distribuite şi de utilizare a nou apărutei (la acea vreme) reţele globale Internet. 


Implementările viitoare tind către utilizarea obiectelor ca element de bază şi 
de includerea conceptului de baze de date mobile în practica normală. 


La mijlocul anilor 1990 are loc dezvoltarea explozivă Internet-ului. Se trece 
la introducerea aplicaţiilor client-server chiar pentru calculatoarele personale. Oferta 
de instrumente de gestionare a bazelor de date prin conectare la Internet creşte 
exponential. Active Server Pages, Front Page, Java Servlets, JDBC, Enterprise Java 
Beans, ColdFusion, Dream Weaver, Oracle Developer 2000, Apache, MySQL sunt 
doar cate exemple. 


Un SGBD trebuie: 


1. să permită utilizatorilor să creeze noi baze de date şi să le specifice schema 
(structura logică a datelor utilizând un limbaj specializat denumit limbaj de 
definire a datelor). 


2. să ofere utilizatorilor capacitatea de a interoga datele (o „interogare” este 
argoticul pentru acțiunea de chestionare a datelor) şi de a le modifica, 
utilizând un limbaj adecvat, adesea denumit limbaj de interogare sau limbaj 
de manipulare a datelor. 


3. să suporte stocarea unor cantităţi foarte mari de date pe perioade lungi de timp, 
ferindu-le de accidente sau de utilizare neautorizată şi permiţând acces 
eficient la date pentru interogare sau modificare. 
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4. să permită accesul simultan a mai multor utilizatori fără să permită ca acțiunile 
unuia să afecteze pe ceilalți şi fără ca accesul simultan să ducă la coruperea 
accidentală a datelor. 


Primele sisteme comerciale de baze de date au părut la sfârşitul anilor 1960. 
Aceste sisteme au evoluat din sisteme de fişiere şi furnizau partial primele trei cerințe. 
Ele erau mai degrabă grupuri de înregistrări. Primele modalităţi practice de a stoca şi 
regăsi date pe calculatoare erau aplicaţii pe fişiere care utilizau un limbaj de 
programare de nivel înalt (ex. COBOL). Principala deficiență a acestei abordări era 
aceea că structura fişierului era descrisă în aplicaţie. Dacă cineva ar fi dorit să 
utilizeze datele într-o altă ER trebuia să scrie din nou descrierea fişierului în 


mA structurii ataşată sau inclusă. Pornind de aici s-au dezvoltat bazele de date. 


Sistemele propriuzise de gestiune a bazelor de date au folosit la început 
diferite modele de descriere a structurilor cele mai populare fiind cea ierarhică sau 
arborescentă şi cea de tip graf sau reţea. ultima fiind standardizată la sfârşitul anilor 
1960 prin raportul CODASYL (Committee on Data Systems and Languages). 
Problema esențială a acestor modele şi sisteme era că nu incorporau şi nici nu se 
bazau pe un limbaj de nivel înalt pentru interogare. 


Următorul pas la constituit a fost constituit de publicarea de către E.F. Codd a 
celebrelor sale lucrări din 1970 şi 1972 ([57], [58]). Aceste lucrări puneau bazele unei 
noi abordări a bazelor de date care erau organizate în tabele denumite relaţii. Pentru 
realizarea lor se puteau utiliza diferite implementări, structuri de date complexe şi 
mecanisme de stocare sofisticate, dar utilizatorul nu era preocupat de acest lucru. El 
gândea totul în termeni de relaţii. Interogarea se baza pe un aparat de lucru matematic 
asemănător celui din teoria mulțimilor ceea ce permitea exprimarea printr-un limbaj 
de nivel înalt. Lucrul acesta creştea eficienţa fata de celelalte tipuri de date. 


3.1. BAZE DE DATE COMPUTERIZATE 


Pe computere inițial omul a creat fişiere pe care le-a structurat pentru a uşura 
manevrarea. Prelucrarea datelor din fişiere, simplă şi eficientă, are însă numeroase 
limitări de aceea a apărut necesitatea realizării bazelor de date. Acestea nu sunt numai 
nişte structuri de fişiere mai exotice ci aduc cu ele o nouă modalitate de gândire 
despre date şi nevoile de exploatare. 


Apar noi activităţi precum analiza datelor şi modelarea datelor care în timp au 
devenit dominante în proiectarea aplicaţiilor. Felurite facilități de verificare a 
integrităţii şi securității datelor au fost adăugate şi incluse într-un sistem de gestiune a 
bazelor de date care face posibil accesul utilizatorilor la resurse şi informaţii. 
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SISTEME DE PRELUCRARE A FIŞIERELOR ee: 


Aplicatiile bazate pe prelucrarea fişierelor, păstrează tot setul de date într-un 
fişier unic sau într-un set de fişiere. Datele care descriu sistemul sau componentele 
sale pot fi păstrate în fişiere separate şi este datoria softului pe care utilizatorul sau 
programatorul îl foloseşte să stabilească relaţiile şi corespondenţa dintre fişiere. 


Pentru fiecare fişier folosit programul trebuie să aibă inclusă permanent o 
interfață care să permită accesul la date. Mai multe fişiere înseamnă mai multe 
interfeţe care să realizeze transferul. În cazul în care există mai multe aplicaţii care 
accesează aceleaşi fişiere interfețele trebuie incluse în fiecare aplicație în parte. Toate 
acestea duc la o "explozie a interfetelor" [54], programatorii trebuind să se ocupe mai 
mult de realizarea preluării datelor decât de problema de rezolvat. 


Este de asemenea la latitudinea utilizatorului să selecteze numai date 
semnificative din fişier şi să „ascundă” înregistrările ce nu sunt necesare. Este, de 
aceea, foarte laborios să proiectezi şi să creezi un program (aplicaţie utilizator) şi este 
şi mai greu să o modifici în caz de necesitate. În multe cazuri, dacă din anumite 
motive, o anumită aplicaţie cerea modificarea formatului unui fişier toate celelalte 
aplicaţii trebuie să adopte un nou format de preluare a datelor deoarece interfaţa lor se 
realiza cu structura fizică a fişierului şi aceasta se modifica. 


Din punct de vedere istoric, este primul sistem identificabil de baze de date şi 
încă se mai utilizează pe scară largă din cauza simplităţii, nevoii de compatibilitate cu 
versiunile anterioare de program şi din cauză că, în timp, sistemele de management al 
fişierelor a evoluat, putând răspunde la cerinţe complexe. 


Un avantaj este dat de faptul că diferite fişiere pot fi păstrate pe diferite 
calculatoare şi pot fi actualizate de persoane diferite. Dezavantajul major este dat de 
imposibilitatea de a păstra confidential conţinutul unui fişier. Securitatea informațiilor 
este serios afectată de posibilitatea de a citi direct fişierul şi a-l transporta pe un alt 
sistem. 


Toate acestea au condus la necesitatea apariţiei unui nou mod de abordare a 
prelucrării datelor prin utilizarea bazelor de date. 


SISTEME INTEGRATE DE PROCESAREA DATELOR 


În acest tip de sisteme datele se stocau într-un singur loc şi structura internă a 
fişierului / fişierelor nu se mai documentează. Principalul pas înainte a fost 
introducerea unui Sistem de Gestiune a Datelor. Acest sistem permite doar 
comunicarea cu nucleul căruia i se transmite interogarea privind datele. Pentru 
aceasta au fost dezvoltate în timp limbaje şi proceduri complete pentru accesare. 


Iniţial sistemele de baze de date erau livrate ca atare numai cu mecanismele 
de acces şi de interogare. Era datoria utilizatorilor să-şi dezvolte aplicaţiile. Ulterior, 
mai ales după apariţia sistemelor de operare grafice de tip Windows, au fost furnizate 
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şi instrumente de construcție a aplicaţiilor. Este acum extrem de uşor de dezvoltat, în 
manieră interactivă, forme de introducere sau de vizualizare a datelor. 


Baza de date este o colecție depozitată de date operaţionale utilizată de 
sistemul de aplicaţii al unei organizaţii. 


Trebuie să facem unele precizări: 


Organizaţie este un termen convenţional pentru a descrie la modul generic 
orice entitate comercială, ştiinţifică, tehnică sau operaţională. 


Câteva exemple: 


e Administraţia Naţională a Drumurilor, 
e Compania Naţională a Căilor Ferate, 
e Directie regională, 

e Sectie, 

e District, 

e Universitate, 

e Facultate, 

e Institut de cercetări, etc. 


Pentru buna funcționare orice organizație trebuie să întreţină un set mare de 
baze de date. Acestea sunt baze date operaţionale. Datele operaţionale ale unei 
organizaţii de administrare a infrastructurii transporturilor pot fi: date de 
management; date de planificare; date de proiectare; date de climat; etc. 


Se poate reduce redundanta datelor stocate: În cele mai multe dintre sistemele 
actuale fiecare aplicaţie are fişiere proprii. Aceasta poate produce o utilizare 
ineficientă a spaţiului de stocare prin redundanta. Utilizarea bazelor de date poate 
identifica şi elimina redundanta. 


Se pot evita problemele de inconsistență a datelor stocate: Din cauza 
existenţei surselor de eroare şi a transmiterii lor este posibil ca în fişiere diferite 
aceleaşi date să aibă valori diferite pentru a descrie acelaşi fapt. În bazele de date se 
va furniza aceeaşi valoare pentru orice interogare, indiferent de utilizator. 


Datele pot fi partajate: Sistemele de baze de date oferă mecanisme prin care 
utilizatorii pot folosi în comun aceleaşi date simultan şi de a utiliza în comun 
aplicaţiile definite. În această manieră datele pot fi actualizate de oricare utilizator şi 
valorile prezentate celorlalți pot fi în permanenţă cele reale. 


Se pot aplica restricţii de securitate: 
Administratorul bazei de date poate: 


ū Asigura ca singurele căi de acces sunt cele autorizate prin 
canale , şi 
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a Defini verificări de autorizare pentru fiecare încercare de 
acces la date importante. Se pot defini proceduri diferite 
pentru fiecare tip de acces (citire, actualizare, ştergere 
etc.) pentru fiecare tip de date. 


Poate fi menţinută integritatea datelor: Bazele de date pot trata mai eficient 
problema integrității. Chiar dacă redundanta este eliminată se pot întâlni cazuri de 
date incorecte din cauza multor factori (eroare umană, defecte hardware, erori de 
programare etc.). 


Cererile conflictuale pot fi rezolvate: Administratorul bazei de date poate 
stabili o importanţă pentru fiecare utilizator şi prin aceasta o prioritate cererilor de 
obținere a datelor pe care le face. 


Independența datelor: Fiecare utilizator sau aplicaţie poate avea propria 
viziune (VIEW) asupra datelor fără ca prin asta să afecteze . 


Pentru a evita obligația utilizatorului de a calcula permanent şi repetat unele 
valori au fost concepute funcţii de tip TRIGGER care se declanşează la apariția 
anumitor evenimente. 


3.2 UTILIZAREA BAZELOR DE DATE 


O bază de date reprezintă un ansamblu de date integrat, anume structurat şi 
dotat cu o descriere a acestei structuri. 


Descrierea poartă numele de dicționar de date sau metadate (informaţii 
despre date) şi creează o independenţă între datele propriu zise şi programe. O bază 
de date este mai mult decât o colecţie de fişiere: ea include, pe lângă acestea, 
dicționarul de date şi o descriere a relaţiilor între înregistrări, descriere chemată şi 
utilizată pe întreaga durată a prelucrării informaţiilor. 


De asemenea, vom numi o bază de date un ansamblu unitar organizat şi 
structurat de date, a căror gestionare se face printr-un sistem specializat, denumit 
sistem pentru gestionarea datelor (SGBD). 


Des uzitată este şi noţiunea de bancă de date care reprezintă ansamblul 
format din: 


- bază de date; 
- sistemul/sistemele care o gestionează (SGBD); 


- echipamentele de calcul utilizate pentru înregistrarea şi memorarea datelor 
din baza de date şi pentru prelucrările efectuate asupra acestor date; 


- procedurile (automate şi neautomate) suplimentare pentru gestionarea datelor, 
în afara celor din cadrul SGBD, în primul rând pentru a face legătura / 
interfaţa cu acestea. 
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SISTEM INFORMAȚIONAL 


SISTEM INFORMATIC 


(SUB)SISTEM BANCĂ DE DATE 


BAZE DE DATE 


SGBD 


SISTEM DE CALCUL 


PROCEBURI-APLICAȚII 
i 


PERSONAL CALIFICAT 


Fig. 25 Sistemul băncii de date 


închis, banca de date este o entitate creată şi menținută de o persoană (fizică sau 
juridică) ori de un compartiment specializat pentru a fi pusă la dispoziţia unui număr 
mare de alți utilizatori, de exemplu publicul. Posedă în general o anvergură net 
superioară bazei de date, dar ceea ce o caracterizează cel mai bine este rigoarea 


necesară exploatării sale [53]. 


Se poate constata că banca de date are aceleaşi componente cu ale oricărui 
sistem informatic şi prin urmare ele vor trebui proiectate şi realizate după aceeaşi 
metodologie ca toate celelalte componente ale sistemelor informatice, folosind însă 
unele metode şi tehnici specifice. 


În Fig. 25 se prezintă locul (sub)sistemului informatic banca de date în 
cadrul sistemului informațional şi informatic al unei organizații. 


Banca de date, în concepţia modernă de realizare a sistemelor informatice, 
devine subsistemul central al acestora, prin el realizându-se principalele legături 
dintre majoritatea celorlalte subsisteme şi aplicaţii, în primul rând a celor care 
lucrează cu datele din baza de date. 


Dacă ne propunem să elaborăm un sistem informatic în care să utilizăm 
pentru gestionarea datelor conceptul de bază de date, atunci, este recomandabil să se 
facă acest lucru la toate sistemele unde se lucrează cu volume mari sau foarte mari de 
date. 


Atunci când rezultă necesitatea utilizării unui SGBD, este recomandabil ca el 
să fie acelaşi pentru întregul sistem informatic al unităţii. 


Facilitatea fundamentală oferită de abordarea prin prisma bazelor de date este 
că permite datelor să fie partajate între diferitele aplicaţii. Arhitectura generală a 
sistemului de baze de date are caracteristica de a aduna toate datele necesare într-un 
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fişier unic sau un set de fişiere. Seturile de date sunt separate numai logic în cadrul 
sistemului. Accesul la date se realizează prin Sistemul de Gestiune a Bazei de Date 
(SGBD) care este o însumare de proceduri software ce înțeleg şi manipulează 
structurile logice din fişier. SGBD pune la dispoziţia utilizatorilor facilități de stocare 
a datelor într-o structură adecvată, facilități de regăsire a lor, de protecție, toate în 
condiţiile obţinerii unei bune performanțe. Ceea ce distinge cu adevărat un SGBD 
este posibilitatea de a descrie independent de reprezentarea lor fizică. În mod ideal, 
structura logică a unei baze de date este independentă de mediul de memorare. 


Structura, pe straturi, a unui SGBD se compune din: 


e nivel extern, văzut de utilizator, caracterizat de o anumită descriere a 
datelor, convenabilă acestuia; 

e nivelul intern, transparent pentru utilizator, cu o altă descriere a datelor, 
conformă cu metodele de organizare şi acces puse la dispoziție de ultimul 
nivel; 

e sistemul de gestiunea fişierelor; 

Deoarece aplicaţiile interacționează numai cu sistemul de gestiune a bazei de 
date nu mai este necesară decât o singură interfață. Mai mult, această interfață se face 
la nivel logic şi nu fizic. De aceea aplicaţiile nu mai trebuie să cunoască structura 
intimă a fişierelor şi nici să-şi modifice modul de lucru de fiecare dată când se 
modifică structura datelor. 


3.3 CARACTERISTICILE BAZELOR DE DATE 


Un sistem de gestiune a bazelor de date îşi propune atingerea unor obiective 
care să definească astfel calitatea lui. Unele dintre aceste obiective sunt greu de atins, 
altele chiar contradictorii. Dar, se admite în general, că un sistem de gestiune a 
bazelor de date trebuie să asigure: 


independenţa fizică; 

independenţa logică; 

utilizarea datelor si de către nespecialisti; 
eficacitatea accesului la date; 
administrarea centralizată a datelor; 
eliminarea redundantei datelor; 

coerenţa datelor; 

partajarea datelor; 

securitatea datelor. 


INDEPENDENȚA FIZICĂ 


Unul dintre obiectivele importante ale unui SGBD îl constituie independența 
structurilor de memorare a datelor faţă de structura lor reală. Structurile de memorare 
trebuie să se supună regulilor de eficiență a memorării şi regăsirii şi nu trebuie să fie 
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afectate de relaţiile existente între datele din lumea reală. Ele nu trebuie să fie 
imaginea organizării datelor din sistemul modelat. Altfel, o schimbare în structura 
externă a datelor ar necesita o reorganizare în structura internă, memorată a datelor. 


INDEPENDENȚA LOGICĂ 


Structura datelor din lumea reală, având o semantică proprie, reprezintă 
punctul de vedere al unui grup de utilizatori. Un alt grup poate avea o altă imagine 
asupra datelor, organizându-le altfel, sau considerând doar o parte a lor. Dacă un 
SGBD reuşeşte să ofere o asemenea structurare a datelor care să permită fiecărui grup 
de utilizatori să vadă datele aşa cum doreşte şi în acelaşi timp să permită grupurilor 
să-şi modifice punctul de vedere fără ca aceasta să afecteze alte viziuni particulare, 
atunci se poate spune că există o independență logică a datelor. 


Împreună, independența fizică şi logică a datelor asigură stabilitatea 
aplicațiilor fata de modificările structurilor externe. 


UTILIZAREA DATELOR DE CĂTRE NEINFORMATICIENI 


Utilizarea de către nespecialişti a datelor stocate într-o bază de date înseamnă 
transformarea sistemului într-un instrument disponibil şi necesar cu o pătrundere într- 
o masă largă de utilizatori. Existenţa independenței logice şi fizice creează 
posibilitatea ca un utilizator să vadă ceea ce doreşte din structurile bazei. Un limbaj 
neprocedural oferă utilizatorului neinformatician posibilitatea de a actualiza şi regăsi 
date fără a se preocupa de modul în care se realizează efectiv aceste operaţii. 


EFICACITATEA ACCESULUI LA DATE 


La baza de date au acces nu numai utilizatorii neinformaticieni ci şi 
specialiştii care asigură crearea şi întreținerea acesteia. Primii folosesc un limbaj 
simplu, neprocedural, în spatele căruia se găsesc însă metode de acces evoluate şi o 
serie de primitive care să asigure construirea unor proceduri inteligibile. Toate acestea 
trebuie să satisfacă un standard de eficiență pentru a face exploatarea posibilă, atât din 
punct de vedere al timpului de răspuns cât şi al calităţii şi varietatii serviciilor oferite 
utilizatorului nespecialist. Astfel, dacă efortul de învăţare şi utilizare a limbajului de 
exploatare a bazei de date este excesiv, se pierde interesul pentru acesta. 


Pe de altă parte utilizatorul specialist, administratorul bazei de date, trebuie să 
dispună de un limbaj de manipulare a datelor suficient de puternic şi flexibil pentru a 
avea acces uşor şi rapid la structurile cele mai intime, la structurile de memorare. 


ADMINISTRAREA CENTRALIZATĂ A DATELOR 

Administrarea datelor într-o bază de date constă în două operaţii principale: 
definirea structurii datelor şi modalitatilor de memorare şi urmărirea evoluţiei lor 
incluzând modificarea unor structuri. Având în vedere importanţa esenţială a acestei 
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funcţii (care în fond asigură integritatea şi acurateţea datelor) este preferabil ca ea să 
fie centralizată într-un singur punct, la dispoziția unui grup de utilizatori privilegiați, 
şi să respecte un singur standard unitar. 


ELIMINAREA REDUNDANȚEI DATELOR 


În sistemele clasice aplicaţiile independente aveau nevoie de date aflate în 
fişiere proprii. Uneori aceleaşi date utile mai multor aplicații erau duplicate în tot 
atâtea fişiere rezultând de aici o utilizare ineficientă a spaţiului de memorare, dar şi 
dificultăți în actualizarea corectă a tuturor datelor comune mai multor aplicaţii. 


Bazele de date permit însă accesul partajat al mai multor aplicaţii la acelaşi 
fişier, eliminând astfel redundanta. Gradul în care redundanta este eliminată depinde 
de proiectarea corespunzătoare a structurilor de date. Totodată, administratorul bazei 
de date trebuie să vegheze ca actualizarea ulterioară să nu producă duplicare de date. 


COERENTA DATELOR 


O condiţie esențială a unui sistem de prelucrare utilizabil şi eficient este 
corectitudinea datelor manipulate. Proiectantii, precum şi cei care exploatează un 
asemenea sistem trebuie să ia toate precautiile pentru a sigura acurateţea datelor. Un 
sistem de gestiune a bazelor de date pune la dispoziţia utilizatorilor facilităţi de 
control a datelor introduse în bază. 


Sunt verificate atât respectarea unor condiţii de validare la nivelul datelor 
elementare, cât şi al interdependentelor între date în aşa fel încât coerenţa datelor să 
fie asigurată. 


PARTAJAREA DATELOR 


Aceasta presupune că ele sunt disponibile mai multor utilizatori. Probleme 
dificile apar în cazul simultaneitatii cererilor de acces la aceeaşi dată. Pentru 
rezolvarea unei asemenea concurente, există mecanisme la nivelul sistemelor de 
gestiune a fişierelor, care sunt preluate de sistemele de gestiune a bazelor de date. 


SECURITATEA DATELOR 

Datele trebuie protejate împotriva accesului neintentionat sau răuvoitor. 
Mecanismele sistemului de gestiune a bazei de date verifică drepturile de acces ale 
utilizatorilor la toate datele, sau la o parte a acestora şi stabileşte modul de acces 
(scriere, citire, ştergere, actualizare). 


3.4 MODELE DE BAZE DE DATE 


În dezvoltarea sistemelor de gestiune a bazelor de date se disting mai multe 
generaţii. 
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Prima generație marchează epoca despărțirii SGBD de sistemele de gestiune 
a fişierelor. Este perioada primelor recomandări CODASYL când se realizează 
independenţa fizică şi logică. Eforturile principale se făceau în direcția reducerii 
timpului de acces, arhitectura SGBD trecând pe planul secund. 


A doua generaţie a fost fundamentată teoretic în anii '70 şi implementată în 
versiuni notabile în anii '80 şi este reprezentată de modelele relationale, care îşi 
propun uşurarea accesului la bazele de date prin crearea unei structuri externe cât 
mai simple şi mai naturale. Aceasta permite implementarea unor limbaje de 
manipulare foarte flexibile. 


Modelele relationale cuprind un set de concepte şi reguli capabile să descrie 
datele şi acestea sunt văzute ca un set de relaţii asupra cărora se pot efectua anumite 
operaţii, definite de algebra relationala, care au ca rezultat obținerea unui nou set de 
relaţii. 


Modelul relational manipulează structuri simple, liniare, neredundante. 
Complexitatea este dată de modul în care se combină flexibil aceste structuri. 
Conceptele de bază sunt: domeniu, tuplu, relaţie, normalizare. 


Domeniul este o mulțime de valori legate semantic, apelabile sub acelaşi 
nume. 


Considerând produsul a două sau mai multe domenii D, x D, x-::x D, se 


obţin n—upluri sau tupluri. O seamă de tupluri astfel obţinute sunt contradictorii între 
ele. Eliminând convenabil aceste situații se obține un număr de tupluri care reflectă o 
realitate. Submultimea rezultată a produsului cartezian se numeşte relaţie. 


Principiul de constituire a unei relaţii este cel al respectării unui fapt din 
realitate. Nu oricare două domenii pot constitui o relaţie. Asocierea lor trebui să 
constituie un tuplu semnificativ. O relație incorectă conține redundante, contradicții 
ori inconsistente. Într-o relaţie se poate defini o cheie primară care identifică în mod 
unic tuplul şi mai multe chei secundare. Cheia primară poate fi constituită dintr-un 
singur atribut fie prin concatenarea mai multor atribute. 


Normalizarea se defineşte ca fiind operaţia de obţinere a unei relaţii corecte 
pe domeniul propus. Aceasta se face în mai multe etape (forme). 


STRUCTURA BAZEI DE DATE 


Pentru atingerea obiectivelor propuse anterior sunt propuse trei nivele de 
descriere a datelor: 


e nivelul conceptual; 
e nivelul intern; 
e nivelul extern. 
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Nivelul conceptual corespunde structurii datelor din realitate, cu semantica 
lor, comună pentru toate grupurile de utilizatori. În lumea reală există date de tip 
elementar (atribute), care descriu un obiect şi care nu pot fi detaliate în continuare. La 
nivelul ierarhic imediat superior se află entitatea, obiectul real descris de atribute. 
Între aceste entităţi pot fi găsite relaţii, asocieri logice care reprezintă nivelul al 
treilea. 


Proiectantul unui sistem trebuie să deceleze exact aceste elemente constituind 
modelul datelor şi interdependenta lor. Acest model (schema conceptuală) cuprinde 
de asemenea şi informaţii referitoare la condiţiile pe care datele trebuie să le respecte. 


Nivelul intern corespunde structurii de memorare a datelor (schema internă). 
La acest nivel se utilizează următoarele concepte: 


e  fişier/fişiere de date caracterizate prin nume, tip de organizare, localizare, 
dimensiuni; 
e înregistrarea fişierului, definită de lungime, câmpuri, componente; 
e cai de acces la înregistrare - prin indecsi, pointeri etc. 
Nivelul extern este propriu fiecărui grup de utilizatori, care vad datele 
conform specificului aplicaţiei lor (schema externă). 


O schemă externă vede doar o parte a bazei de date şi într-o structură proprie. 
Această particularitate are şi avantajul că oferă un mecanism în plus pentru asigurarea 
integrității şi securităţii datelor. 


3.5. ARHITECTURA BAZELOR DE DATE 


Grupul ANSI/X3/SPARC propune o arhitectură constând din două părți 
principale: 


e o parte care permite descrierea datelor; 
e oparte care asigură manipularea datelor. 
Structura 


Procesorul schemei conceptuale, care permite descrierea schemei conceptuale 
a datelor, compilarea ei şi depunerea în metabaza; 


Procesorul schemei interne utilizat pentru descrierea schemei interne, a 
legăturilor ei cu nivelul conceptual, compilarea şi depunerea în metabază; 


Transformatorul conceptual-intern utilizat pentru conversia între cele două 
nivele de descriere a datelor; 


Transformatorul extern-conceptual care realizează manipularea datelor 
conform punctului de vedere al schemei externe; 
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Limbajul de manipulare a datelor externe care permite programatorului de 
aplicaţie să aibă acces la date conform cu punctul de vedere al schemei externe; 


Interfața de acces la dicționarul de date, prin intermediul căreia procesoarele 
şi celelalte elemente de arhitectură descrise deja, pot să aibă acces la scheme şi reguli 
de conversie compilate şi aflate în metabază. 


Un exemplu de arhitectură este prezentat în figura următoare: 


Schema 


conceptuală 
Schema P 


internă 


Schema 
externă 


Procesorul 
schemei 


Procesorul conceptuale Procesorul 


schemei interne ae schemei externe 
Pe, l 
= y Dicționarul de date 


(meta-baza) 
Sr we aa 


Transformatorul | Transformatorul 
conceptual/intern [* * extern/conceptual 


| 


Limbaj de 
manipularea a 


datelor externe 


Baza 
de date 


Programe de aplicatie 


UL 


Fig. 26 Structura funcțională a unei baze de date 


Tendintele actuale de dezvoltare sunt de realizare a sistemelor de gestiune a 
bazelor de date distribuite şi cu procesare paralelă şi SGBD orientate pe obiecte. În 
general aceasta a apărut ca necesitate a decalajului semnificativ între evoluția rapidă a 
tehnologiilor hardware şi de comunicaţie ce permit realizarea de medii eterogene 
complexe utilizând maşini tot mai performante şi realizările caselor de soft care susţin 
SGBD relationale. 
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3.6 CONCEPTE AVANSATE DE BAZE DE DATE 


Denumirea de baze de date avansate este doar un apelativ generic. Ceea ce 
astăzi este avansat va fi perimat peste un deceniu sau două. Totuşi, sub acest nume se 
regăsesc ultimele tendinţe din domeniu şi cea mai mare parte din munca 
universităților şi a diviziilor de cercetare. Deşi nu sunt clar definite şi separate 
tendințele interferează şi utilizează filosofii comune. Caracteristicile cele mai frecvent 
întâlnite sunt: 


QO Sisteme de gestiune cu procesare paralelă; 
a Sisteme distribuite geografic; 

a Baze de date orientate pe obiect; 

a Capacitati grafice. 


Unele dintre aceste sisteme au influenţe din domeniul inteligenţei artificiale, 
la rândul ei aceasta fiind una dintre principalele aplicații. 


SGBD CU PROCESARE PARALELĂ 


Se bazează pe capacitatea procesoarelor de a oferi servere în multiprocesare 
simetrică(SMP), multiprocesare asimetrică sau procesare pe mai multe căi de control 
a execuţiei (multithreaded). Toate acestea implică rularea de task-uri multiple pe 
diferite procesoare. Diferenţa rezidă în faptul că dacă procesarea paralelă simetrică 
sau asimetrică implică mai multe procese ce se execută pe mai multe unități de 
prelucrare, multitheading are un singur proces ce se poate rula pe mai multe unități de 
prelucrare utilizând acelaşi context de mediu. 


Tipuri de arhitecturi paralele 


Cele mai utilizate arhitecturi hardware paralele ce exploatează multiple 
procesoare, memorii mari şi mai multe unități de disc sunt: 


e arhitectura "shared nothing" în care fiecare procesor deține 
propriile sale unități de memorie şi de disc; 


e arhitectura "shared discs" utilizează multiple procesoare, fiecare 
cu unitatea sa de memorie dar sus sistem de disc partajat. 


e arhitectura "symmetric multiprocessing" utilizează procesoare 
multiple care deţin în comun unitățile de memorie şi de disc. 


Sistemele dezvoltate pentru acest tip de calculatoare sunt în general extensii 
ale SGBD relationale îmbunătăţite pentru a beneficia de procesarea paralelă în 
sisteme eterogene şi de a permite rularea de aplicații complexe cu misiune critică. Ele 
utilizează o serie de noţiuni abstracte şi strategii asociate pentru a îndeplini cerinţele 
actuale. De exemplu au fost create monitoare de procesare a tranzacţiilor ce reprezintă 
utilitare evoluate care gestionează tranzacțiile distribuite în reţele eterogene. 
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Din punctul de vedere al asigurării integrităţii datelor în sistemele 
client/server distribuite, producătorii de software de gestiune a bazelor de date au 
abordat următoarele strategii: 


e tehnica "two-phase commit" prin care toate modificările impuse de o 
tranzacţie asupra unei baze de date sunt fie comise (execuţia tranzacţiei 
este finalizată) fie sunt anulate, cu revenirea bazei de date în stare 
anterioară efectuării tranzacţiei. Această strategie asigură faptul că toate 
serverele deţin copii identice în orice moment 

e strategia de replicare a datelor este în prezent soluția adoptată de marii 
producători. Replicarea constă în realizarea mai multor copii identice ale 
bazei de date. Garantia identităţii este asigurată numai în anumite momente 
sau sub anumite condiții. 


BAZE DE DATE DISTRIBUITE 


Un sistem distribuit implică existenţa unui număr de noduri de prelucrare în 
care există nişte colecţii locale de date ataşate fiecărui procesor. 


Conceptual acestea pot fi privite, în context distribuit, ca parti ale unei 
aceleiaşi colecţii de date, unică din punct de vedere logic, dar distribuită topologic. 


Într-o bază de date distribuită spaţial fragmentele unei baze de date logice 
(baza de date aşa cum este văzută de utilizator) sunt în fapt câteva baze de date fizice 
fiecare fiind stocate pe diferite sisteme de calcul din diferite locaţii. În bazele de date 
distribuite de importanță critică devine costul transmiterii datelor pe canalele de 
comunicaţie. Proiectantii sistemului trebuie să minimizeze timpul de aşteptare a 
informaţiilor precum şi cantitatea de date care este transmisă efectiv de la o locaţie la 
alta în reţea. 


Dispersia geografică şi autonomia colecţiilor de date sunt caracteristicile 
acestui tip de sisteme de gestiune a bazelor de date. Este necesar un software 
generalizat de gestiune care să permită facilităţi de organizare, acces şi control a 
datelor rezidente în diferite noduri de prelucrare interconectate fizic şi logic. Preluând 
funcţiile unui SGBD local, un sistem în context distribuit trebuie să asigure o bună 
funcţionalitate mai ales pentru următoarele activități: 


definirea unei arhitecturi în acord cu topologia sistemului; 

controlul prelucrării distribuite a informaţiilor din baza de date; 

controlul accesului concurent la datele distribuite; 

menținerea integrității datelor în prezenţa defectelor hardware sau software; 
optimizarea timpului de răspuns al sistemului; 

menţinerea copiilor multiple ale bazei de date. 
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BAZE DE DATE ORIENTATE PE OBIECT 


Modelele relationale sunt legate de abordarea bazată pe separarea datelor şi a 
prelucrărilor. Aceste modelele sunt în general inadecvate pentru construirea 
obiectelor din domenii cum ar fi CAD, administrarea documentelor, birotică, 
inginerie software, sisteme de informare, sisteme multimedia. În modelele relationale 
nu există noțiunile de clasă şi nici de obiect. Orice obiect ar trebui descompus in mai 
multe relaţii şi se stabilesc o sumă de legături pentru reconstituirea obiectului din 
parti. O altă scădere este în diferenţa dintre limbajele de interogare şi manipulare şi 
limbajele de programare. Limbajele de programare şi limbajele de manipulare a 
bazelor de date sunt destul de dificil de integrat. 


Pentru a rezolva aceste exigente au apărut două tendinţe. 


Prima abordare constă în extinderea modelului relational. Extensiile 
integrează concepte precum agregare şi generalizare, noțiunea de clasă, seturi de 
atribute valorice, tipuri abstracte de date. De asemenea apare integrarea noţiunii de 
operatori atasati unei proceduri. Operatorii sunt consideraţi ca atribute ale unei tabele 
şi conduc la definirea de noi tipuri de atribute. 


În a doua abordare, ce se sprijină pe modele obiectuale, un obiect este 
considerat ca un tot unitar şi nu ca o mulţime de n-uple. Atributele unui obiect pot fi 
la rândul lor considerate obiecte. În linie generală, SGBDO integrează majoritatea 
functiunilor unui SGBD traditional şi în plus oferă un limbaj de programare orientat 
pe obiecte pentru a defini schema bazei, pentru manipularea obiectelor şi codificarea 
aplicaţiilor. Aceasta permite combinarea avantajelor programării orientate pe obiect 
cu conceptele de coerenţă, partajare, integritate proprii bazelor de date. Se reduce 
astfel la minim diferenţa dintre reprezentarea obiectelor la nivel conceptual şi nivel 
intern. Un obiect oricât de complex ar fi păstrează aceeaşi reprezentare în memorie ca 
şi pe disc ceea ce face ca să se elimine problemele de conversie de tip şi de structură. 
Legăturile dintre obiecte se păstrează la nivelul bazei de date. 


Limbajele de programare orientate pe obiect s-au răspândit în mediile 
inteligenței artificiale. Ele propun o nouă abordare a programării care îşi datorează 
originalitatea fuziunii naturale dintre prelucrare şi date. 


Conceptul de bază este obiectul, pe care îl putem defini ca fiind reprezentarea 
unei entităţi a lumii reale. În baza de date obiectul este identificat într-o manieră unică 
printr-un identificator, numit OID (Object IDentifier), atribuit de sistem. Două obiecte 
având OID diferite sunt considerate ca diferite, spre deosebire de SGBD-urile 
relationale unde obiectele (tuplurile de valori corespunzând atributelor tabelei) nu 
sunt identificate decât prin valorile lor. 


Principii de bază în orientarea pe obiect: Abstractia, incapsularea, 
modularizarea, ierarhizarea. 
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Abstractia 


Orice model care include aspectele cele mai importante, esențiale şi 
definitorii ale unor entități, suprimând sau ignorând detaliile mai putin importante, 
imateriale, diversificatorii. Rezultatul eliminării distinctiilor este evidențierea 
caracteristicilor comune. 


În final caracteristicile abstractiilor sunt „capturate” drept clase şi obiecte ale 
modelului. 


Incapsularea 


Localizarea fizică a facilitatilor într-o abstracție de tip cutie neagră care le 
ascunde implementarea în spatele interfeţei publice. 


Elimină dependenţa directă de implementare. Clienţii nu sunt afectaţi de 
modificarea implementării. Clientii pot interactiona numai prin interfață. 


Modularizarea 


Descompunerea logică şi fizică a lucrurilor în grupări simple care ajută la 
atingerea scopurilor de analiză. 


Sparge sistemele în piese mai mici cu comportament mai simplu. Interfetele 
dintre piese trebuie bine definite. 


Terarhizare 


Orice ordonare sau aranjare într-o structură de tip arborescent. Aceasta 
corespunde organizării modelului dintr-un anumit punct de vedere. 


Un obiect este descris prin ansamblul de proprietăţi constituit din atribute şi 
metode. Posibilitatea de a face private aceste proprietăţi vis-a-vis de obiect se 
numeşte încapsulare. Altfel spus, nici un alt obiect nu cunoaşte metodele unui obiect 
dat decât prin semnăturile lor (numele metodei, lista parametrilor şi tipul rezultatului 
returnat) şi nu are, în principiu, nici un mijloc de a accede la atributele acestuia, care 
sunt manipulate prin metode proprii. 


Obiectele de aceeaşi natură sau prezentând similitudini sunt grupate în cadrul 
unei clase în care sunt declarate toate atributele şi metodele care le manipulează. O 
clasă este astfel un tipar pentru o mulţime de obiecte de acelaşi fel. Crearea unui nou 
obiect implică utilizarea instanţelor şi metodelor clasei din care aparține. 


Pentru a nu redefini aceleaşi atribute şi metode au fost create mecanisme de 
moştenire prin factorizarea proprietăților comune. Clasa nouă fiind nevoită să 
definească numai atributele şi metodele suplimentare. 
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Implementarea bazelor de date orientate pe obiect (BDOO) 


BDOO combină conceptele orientării pe obiect, construcțiile programării şi 


referentiala şi netezeşte diferenţele dintre limbajele de programare şi bazele de date. 


Orientare-pe-obiect = tipuri abstracte de date + moştenire + identitatea obiectelor 


Proprietăţile bazelor de date preluate şi dezvoltate de BDOO sunt: persistenta, 
tranzacții, controlul concurenței, recuperarea, tratarea cozilor de aşteptare, versiune, 
integritate, securitate şi performanţă. 


1. 


Persistenta: Capacitatea de a furniza aceleaşi date şi datele corecte in 
două tranzacții diferite. Aceste date trebuie stocate pe un suport 
permanent. 
Tranzactia: este o secvenţă de program care fie este executată in 
întregime fie nu este executată de loc. (aceasta se numeşte atomicitate); 
Controlul concurenţei: Sistemul furnizează o ordine in timp a 
tranzacţiilor utile (o ordine serială de execuţie); 
Recuperarea: Trebuie să garanteze că rezultatele parțiale obținute în 
urma unor actualizări incomplete desfăşurate în tranzacţii eronate nu se 
propagă în bazele de date persistente. Exemple de tipuri de eroare pot fi: 
Eşecul tranzacţiei (cauzat de conflicte între tranzacţii concurente); 


Defecte de sistem (eroare software în sistemul de operare, în SGBD 
sau cădere de tensiune); 


Defectarea dispozitivelor de stocare (uzual produse de căderea 
discurilor sau alte cauze). 


Interogare: Se presupune existența unui limbaj de interogare şi a 
mecanismelor de acces. Utilizatorii pot specifica ce doresc fără să fie 
preocupaţi de cum sunt stocate fizic datele. 

Versiune: Capacitatea de a oferi acces la stări anterioare ale obiectelor 
după ce au fost executate unele tranzacții. Aceasta poate arăta evoluția 
obiectelor. 

Restrictii de integritate: Bazele de date trebuie să permită accesul numai 
în stări stabile. Toate accesele către o zonă afectată de procese de 
tranzacție trebuie blocate până când tranzacţia a fost corespunzător 
încheiată. 

Securitate: trebuie definite o parolă şi drepturi de acces pentru fiecare 
utilizator. 

Probleme de performanţă: La momentul actual BDOO au reputaţia de a 
fi bogate în funcționalitate dar slabe în performanţe ceea ce înseamnă că 
mai trebuie lucrat pentru a obține o viteză ridicată. 
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TENDINŢE VIITOARE 


Baze de date uriaşe vor necesita noi mijloace de manipulare şi analiză. Baze 
de date ştiinţifice foarte largi (de ordinul teraoctetilor) pentru explorarea spaţiului, 
securitate naţională, proiectul genomului uman, date de analiză geologică depăşesc 
bariere şi ridică noi probleme. Depozitele de date (data warehousing), cariere de date 
(data mining) şi târguri de date (data marts) sunt tehnici comune astăzi. Succesoare 
ale SQL, şi probabil ale SGBDR, vor fi dezvoltate pentru astfel de realizări. Cele mai 
multe dintre succesoare actuale ale SQL nu sunt încă utilizate la capacitate potenţială. 


Bazele de date mobile sunt un nou produs care apare pe piaţă. 


Viitorul aparține bazelor de date inteligente. Bazele de date tind să 
încapsuleze cele mai noi concepte din domeniul tehnologiei informaţiei. Accesul la 


prezentarea atractivă a informațiilor. 


3.7. AVANTAJE ŞI DEZAVANTAJE 


Avantajele utilizării bazelor de date 


e Se asigură controlul şi chiar eliminarea redundantei; 

e Consistenta datelor; 

e Mai multe informaţii din acelaşi set de date; 

e Partajarea datelor; 

e Îmbunătăţeşte integritatea datelor; 

e Îmbunătăţeşte securitatea; 

e Impune respectarea standardelor; 

e Economie de scală; 

e Echilibrează conflictele dintre interogări; 

e Îmbunătăţeşte accesibilitatea şi disponibilitatea datelor; 

e Productivitate crescută; 

e Îmbunătăţeşte posibilitatea de întreţinere prin asigurarea independenţei 
datelor 

e Îmbunătăţeşte concurenţa aplicaţiilor; 

e Datele pot fi uşor partajate între aplicaţii, eliminând prin aceasta duplicarea şi 
probleme de întreţinere ce derivă din duplicare; 

e Apeluri noi sau cereri de un anumit tip pot fi mult mai uşor implementate, 
datorită faptului că interfaţa logică cu SGBD este mai simplă decât un set 
de interfeţe fizice; 

e Programele de aplicaţie sunt independente de datele stocate. Dacă formatul de 
stocare se modifică, nu este necesar să se modifice programele de aplicaţie, 
de vreme ce ele comunică logic cu SGBD; 
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e Se poate considera că un SDBD unic pentru o bază de date integrată permite 
o mai bună gestionare a datelor, de vreme ce ea este într-un singur loc sub 
supravegherea unui colectiv omogen; 

e Integrarea şi partajarea datelor între aplicaţii dau posibilitatea unei programări 
sofisticate cu transmiterea de informaţii între utilizatorii bazei de date. 


Dezavantajele utilizării bazelor de date 
Ar fi necinstit să pretindem că bazele de date nu au dezavantaje: 


e Sistemul de gestiune a bazelor de date şi echipamentul necesar pot fi scumpe 
şi pot avea preţuri de operare ridicate. Totuşi ele pot fi, in general, 
contrabalansate de o productivitatea înaltă. 

e Se impun costuri ridicate pentru echipamentul hardware; 

e Un SGBD este mult mai complex decât o prelucrare de fişiere şi are 
dimensiuni mari. 

e În particular, recuperarea după o defectiune poate fi dificilă. Un sistem de 
baze de date poate fi mai vulnerabil la defecţiuni decât un sistem de 
procesare a fişierelor. Impactul unei defecţiuni este mult mai mare datorită 
interacțiunii mai multor aplicaţii. 


Este evident că trebuie făcută o analiză amănunţită şi o balansare între 
avantaje şi dezavantaje în contextul particular al mediului şi aplicaţiei considerate. 
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MODELE DE DATE UTILIZATE 


4.1. DEFINIȚII 


Inainte de a trece efectiv în revistă conţinutul acestui capitol trebuie să 
prezentăm câteva definiții. 


(N)-tuple reprezintă un set de (n) valori-atribut reprezentând o singură realizare a 
combinării domeniilor. 

Atribut extern: este un atribut al unei entități care este importat, prin relațiile 
stabilite, de la o altă entitate. 

Atribut local: un atribut al unei entități ce este definit din proprietățile intrinseci ale 
acelei entități. 

Atribut: o funcție pe un domeniu pentru fiecare realizare a tuplelor. Atribuie o 
singură valoare (dintr-o mulțime bine definită) fiecărui individ din mulțimea 
entităților. Este o caracteristică a entității care se selectează pentru a fi inclusă în 
modelul E-R. 

Atribute surogat: un atribut al unui tip de entitate care este conceput de proiectantul 
bazei de date fără legătură cu regulile semantice care definesc entitatea. 

Bază de date: un set de relaţii. 

Cardinalitate: numărul de tuple pe care le are o relaţie. Este o restricție asupra 
relației care descrie numărul maxim de indivizi dintr-o set activ ce poate fi corelat 
cu un singur individ dintr-un alt set activ. Cardinalitatea poate fi unul-la-mai- 
multi, mai-multi-la-unul, unul-la-unul. 

Cheie (candidat): o (super)cheie care este minimală (care nu mai are un subset 
corespunzator care sa identifice unic fiecare tuplu din relatie). Pot exista mai 
multe pentru fiecare relatie. 
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Cheie (supercheie): un set de atribute a cărui valori grupate identifică unic fiecare 
tuplu din relație. 

Cheie externă: este o cheie candidat a unei relații situată într-o altă relație. 

Cheie primară: o cheie candidat aleasă a fi cheia principală a unei relaţii. Pentru o 
relație există o singură cheie primară. 

Colecţie: este un set de înregistrări, fiecare cu acelaşi număr şi tip de elemente de 
date. 

Domeniul: mulţimea tuturor valorilor posibile ce corespund unui atribut şi care pot fi 
stocate. Un domeniu are un format şi un tip. 

Element al entității: un obiect specific (obiect fizic sau conceptual, eveniment, faptă) 
asociat cu activitatea. 

Elemente de date: fiecare dintre valorile elementare care sunt stocate în bazele de 
date. Fiecare dintre elementele de date are tip de dată (pe scut tip) şi pot fi grupate 
într-o înregistrare. 

Entitate: este oricare „ceva” care este parte a problemei şi care trebuie reprezentat în 
baza de date. 

Gradul: este numărul de atribute pe care le are o relaţie; 

Înregistrare: un set de unul sau mai multe elemente de date cu nume propriu. 

Legătură: împerecherea unui individ dintr-un set activ cu un individ dintr-un alt set 
activ. 

Mapare: setul tuturor legăturilor dintre membrii individuali ai seturilor active. 

NULL: o valoare constantă specială, compatibilă cu domeniul oricărui atribut care 
denotă faptul că atributul este nedefinit pentru un element al entității. 

Produs cartezian: Produsul cartezian (-) între mulțimi este mulțimea tuturor 
combinațiilor posibile între elementele seturilor. 

Relatie: un subset al produsului cartezian al domeniilor sale. 

Rolul: mai multe atribute pot avea acelaşi domeniu, dar atributele indică rolul diferit 
în relație. 

Schema relaţională: o descriere a conexiunii dintre două tipuri de entități conforma 
cu maparea membrilor unui set activ la membrii altui set activ. 

Setul activ (al unui tip de entitate): toate acele entități individuale de un anumit tip 
care participă la momentul respectiv la o activitate. 

Tipul entității: o clasă de individualitati asociată cu acţiunea, care poate fi descrisă 
de un set finit de reguli sintactice şi semantice determinate de acţiune — pe baza 
proprietăţilor lor reale, intrinseci şi a rolului lor în acţiune. 

Valoare-atribut: rezultatul funcţiei atribut. Fiecare realizare este reprezentată de o 
valoare-atribut extrasă din fiecare domeniu şi o valoare specială NULL. 


4.2. MODELE DE DATE 


Un model de date este o colecţie de concepte care descriu datele astfel încât 
ele să poată fi asociate şi incluse într-o bază de date. 
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Într-un mod mai formal, un model de date este o combinaţie a cel puţin trei 
componente: 


e O colecţie de tipuri de structuri de date; 

e O colecție de operatori sau reguli de raționament care pot fi aplicate oricărei 
instanţe valide a tipurilor de date; 

e O colecţie de reguli generale de integritate care definesc implicit sau explicit 


Este importat de observat că modelul de date este o construcţie logică care se 
realizează ulterior pe diferite platforme hardware şi software. De aceea, acelaşi model 
de date poate avea diferite aparente, performanțe, eficiență, limite, costuri etc. funcție 
de implementare. 


MODELUL ENTITATE-RELATIE 


Cel mai răspândit model de reprezentare abstractă a structurii bazelor de date 
este modelul entitate-relatie (model E/R). In acest model structura datelor este 
reprezentată grafic printr-o „diagramă entitate-relație”.[79] 


Modelul E/R implică utilizarea a trei elemente: entitatea, atributul şi relația. 


Entitatea 7 1 


Entitatea este „ceva” care este parte a problemei şi care trebuie reprezentat in 
baza de date. Poate fi un obiect fizic (o persoană, o clădire, un tunel etc.), conceptual 
(o instituţie, un proiect etc.) sau faptic (o revizie periodică a fost efectuată şi au fost 
efectuate măsurători care trebuie stocate). În sens larg, o entitate este un obiect 
abstract de orice natură. O colecţie de entităţi similare formează un set de entități. 


Există asemănări între entitate, aşa cum a fost prezentată mai sus, şi termenul 
de obiect din programarea orientată pe obiect. Totuşi, modelul E/R este un concept 
static implicând doar structuri de date nu şi operaţiile asupra datelor (Ullman şi 
Widom 2001 [84]). 


Pentru termenul entitate putem să găsim mai multe semnificaţii care rezultă 
din context. Dacă există posibilitatea de confuzie înţelesul trebuie specificat în clar. 


O entitate individuală este un lucru specific (obiect fizic sau conceptual, 
acțiune sau eveniment) asociat cu un fapt. Referirea la o entitate individuală se face 
cu articol (hotărât sau nehotărât). 


Un tip de entitate este o clasă de entităţi individuale care pot fi descrise 
colectiv printr-un set finit de reguli sintactice şi semantice determinate de necesitățile 
specifice ale administratorilor şi utilizatorilor. Acestea sunt prototipuri care definesc 
indivizii. În diagramele E-R sunt reprezentate tipurile de entitate. 


Referirea se face nearticulat sau la plural. 


56 


Baze de date şi algoritmi pentru căi de comunicaţie 


Setul activ al tipului de entitate reprezintă secţiunea din mulțimea totală a 
indivizilor care participă la un realizare. In modelul E-R nu suntem interesaţi de setul 
activ decât în execuție, acesta fiind rezultatul aplicării unei interogări. 


Referirea se face utilizând pluralul. 


De notat că entităţile individuale, tipurile de entitate şi seturile active există 
efectiv în realitate dar nu pot fi stocate direct în baza de date. Trebuie să identificăm 
caracteristicile care definesc fiecare entitate. 


Atributele 


În cadrul modelului, entităţile trebuie caracterizate pentru a se diferenţia din 
setul de entități. Aceasta se face prin proprietăţi care se ataşează entităților şi poartă 
denumirea de atribute. Atributele au, în general, valori atomice: întregi, reali, şiruri 
de caractere. Există şi variante ale modelului E/R în care atributele au formă 
structurată. 


În proiectarea unei baze de date trebuie identificate caracteristicile esenţiale 
ale unei entități şi mulțimea valorilor care pot fi acordate acestor caracteristici. 
Noţiunea de ,,esential” se referă la contextul specific in care bazele de date şi 
aplicaţiile aferente vor fi utilizate. 


De exemplu, când se realizează o listă a personalului care lucrează în 
administrația drumurilor este total irelevant să stocăm date privind culoarea părului, 
înălțime, culoarea ochilor etc. pe când un sistem de baze de date al poliției consideră 
tocmai aceste date de importanță deosebită. 


Spre deosebire de entităţi, atributele pot fi stocate în computer. Ele sunt 


definite ca valori stocabile, cuprinse într-un anumit domeniu. 


Exemple 


e Persoanele angajate au nume, prenume, funcție, studii, adresă, telefon, 
competenţe etc. 


e Sectoarele rutiere au poziţie, lățime, material de construcție, pantă 
longitudinală, pantă transversală, acostament etc. 


e Podurile au poziţie, lungime, lăţime, număr de benzi, număr de deschideri 
etc. 
Relațiile 


Relaţiile sunt conexiuni care se stabilesc între entități. Relația poate apare 
între două entități (relație binară) dar este posibilă relaţia între oricâte entități. 


Relaţiile reprezintă o hartă a legăturilor dintre membrii fiecărui set de entități. 
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În fapt există mai multe niveluri de noţiuni legate de conceptul de relaţie. 


Tabelul 1. Noţiunea de entitate 


Conceptul de entitate Concepte relationale 
Tip de entitate Relatie 

Set activ Harta conexiunilor 
Entitati individuale Legături 


Restrictiile numerice ale relaţiilor 

Relaţia dintre două tipuri de entități se caracterizează prin restricții legate de 
dimensiunea maximă a seturilor active care pot participa (restricţii de cardinalitate). 
Pot exista relații: 


e Unul la unul — când există o legătură strictă biunivocă între un sigur individ 
din fiecare tip de entitate; 

e Unul la mai multi — unui individ din primul tip de entitate îi corespund mai 
mulți membri din al doilea tip de entitate; 

e Mai multi la unul — mai multi membri ai primului tip de entitate sunt legați 
de un membru al celui de al doilea tip de entitate. 


Reprezentarea restrictiei de cardinalitate se face conventional după cum se 
prezintă în figura următoare: 


unul 


multi 


Fig. 27 Reprezentare restrictiilor de cardinalitate 


Diagrame entitate relatie 


O diagramă entitate-relatie (diagramă E/R) este un graf care reprezintă seturi 
de entități, atribute şi relații. Elementele din fiecare sunt reprezentate de nodurile 
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grafului. Pentru fiecare tip de element se utilizează reprezentarea prin forme speciale 
predefinite, stabilite prin convenție. 


Cele mai utilizate reprezentări convenţionale sunt: 


e Setul de entităţi este reprezentat prin dreptunghiuri; 
e Atributele sunt reprezentate prin elipse; 
e Relaţiile se reprezintă prin romburi 


Laturile grafului conectează o entitate de atributele sate şi seturile de entități 
de relațiile desemnate. 


Nume 


COD 
POD ADMINISTRATOR 
An construcție Nivel_decizional 


OBSTACOL 


Adâncime 


Fig. 28 Reprezentare Entitate — Relatie 


În figura de mai sus am prezentat un exemplu de diagramă entitate-relatie 
simplă pentru trei seturi de entităţi, fiecare cu atributele sale. Seturile de entităţi sunt 
conectate de relațiile specifice. Astfel podurile traversează obstacole şi tot podurile 
aparțin unor administratori. 


Atribute ale relației 


Uneori este imposibil sau extrem de dificil a ataşa anumite atribute cu un set 
de entități. In astfel de situaţii este convenabil a ataşa atribute la relație. 


Să consideră, de exemplu, că se stabileşte un contract pentru realizarea 
lucrărilor de reabilitare ale unei lucrări de artă. La contract participă executantul 
lucrărilor desemnat drept „constructor” şi gestionarul lucrării de artă — 
„administratorul”. 


Deoarece la realizarea reabilitării pot participa mai multi executanti 
contractuali nu putem ataşa prețul contractului la entitatea numită „reabilitare”. 
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Constructorul poate participa la executarea mai multor contracte simultan, iar 
administratorul, la rândul său, gestionează mai multe activităţi. Nu este convenabil să 
ataşăm atributul „valoare negociată” de nici-unul dintre seturile de entităţi. Locul său 
este lângă relaţia numită „contract”. 


Reabilitare Contract Constructor 


An execuţie Cod Fiscal 


Administrator 


<a 
50 eS, 


Fig. 29 Reprezentare Entitate — Relaţie pentru atribute ataşate relaţiei 


Chiar dacă uşor de manipulat, acest concept nu este absolut necesar. Se poate 
crea o nouă entitate căreia i se ataşează atributul necesar şi se adaugă entitatea în 
relaţie. 


Reprezentarea atributelor 


Înaintea definitivării modelului, trebuie să identificăm atributele care 
reprezintă relaţia. Totodată trebuie să stabilim motivaţia şi consecinţele alegerii unui 
atribut. 


Exemplu: Presupunem că un constructor încheie contracte pentru lucrări. Pe 
perioada construcţiei, atributele ataşate constructorului devin atribute ataşate lucrării. 


Deosebim trei tipuri de atribute: 


e locale, 
e surogat şi 
e străine. 


Atributele locale: sunt atributele intrinsec definite tipului de entitate. Aceasta 
înseamnă că indiferent de relaţiile în care este implicată entitatea atributul este 
prezent şi are o valoare bine definită. Numele este un atribut local al constructorului. 


Atributul surogat: reprezintă un atribut al tipului de entitate care a fost 
inventat pentru o mai bună manipulare a datelor. Codul numeric personal pentru 
angajaţi, codul fiscal pentru societăți sau un număr unic de identificare acordat 
automat de sistem pot fi considerate atribute surogat. Ele reprezintă doar convenții 
fără corespondent în realitate dar asigură o mai bună distincție între indivizi. 
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Atribut străin: reprezintă un atribut al unei entităţi care este ataşat unei alte 
entități aflate în relaţie cu prima pe durata relației. Dacă avem contracte de lucrări 
efectuate de un constructor, pe perioada relaţiei atributele care îl identifică pe 
constructor devin atribute ale contractului. 


4.3. DEZVOLTAREA BAZELOR DE DATE 


NIVELE ALE ARHITECTURII BAZELOR DE DATE 
Există trei nivele ale arhitecturii bazelor de date: 


a Nivelul conceptual; 

Q Nivelul logic; 

a Nivelul fizic. 

1. Nivelul conceptual: defineşte principiile structurii (fişiere, reţele, pointeri, 

tabele relationale etc.). Aceasta este doar o abstractizare a lumii reale care 

se concentrează asupra elementelor de informaţie care sunt relevante 
pentru utilizatorii bazei de date. 

2. Nivelul logic: Structurile bazei de date sunt definite la nivelul schemelor. 

Schemele includ o descriere a tipurilor de înregistrări şi a modurilor în 

care sunt corelate. 

a) Dezvoltarea de scheme şi dicționare de date: Trebuie identificate 
relaţiile şi atributele şi se cataloghează în dicţionare de date. 
Dicţionarul de date este, el însuşi, o bază de date constând din 
conceptele esenţiale pe care ar trebui să le cunoască utilizatorii care 
lucrează cu baza de date. Funcţiile furnizate de dicționar sunt: 

(i) Definirea câmpurilor şi fişierelor; 

(ii) Definirea relațiilor; 

(iii) Definirea schemelor şi sub-schemelor externe (cum 
pot fi accesate datele, lista câmpurilor, lista relațiilor 
etc.) 

(iv) Definirea elementelor fizice importante: localizarea 
datelor, volum etc. 

(v) Definirea viziunilor. 

b) Scheme de ierarhie şi rețea: stabileşte legături între înregistrările din 
baza de date. Aceasta se ilustrează într-un mod specific. Sistemul 
trebuie să includă: 


(i) Declarația numelor de scheme; 
(ii) Una sau mai multe declarații ale tipurilor de 
înregistrare; 


(iii) Una sau mai multe declarații de seturi care definesc 
relațiile dintre tipurile de înregistrări; 

(iv) Una sau mai multe declaratii ce definesc zonele 
fizice în care se stochează înregistrările. 
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c) Scheme relationale: furnizează un model de a privi datele. Utilizând 
algebra relationala datele pot fi reunite, proiectate, selectate etc. 
3. Nivel fizic: abordează probleme specifice implementării. Include 
accesarea şi metodele de management a datelor (secvențial, indexat etc.). 


MODELE DE BAZE DE DATE 


În dezvoltarea bazelor de date s-au utilizat mai multe modele: 


e Modelul ierarhic, 
e Modelul reţea, 
e Modelul relational. 


Modelul ierarhic 


Modelul a fost dezvoltat în anii '60 la North American Rockwell. 


Acest model se referă la aranjarea ordonată datelor într-o structură de forma 
unui arbore cu rădăcina în sus. Un exemplu este cel prezentat în figura următoare: 


AGENŢIE 


DIRECŢIA DE STUDII Direcţia Regională 1 Direcţia Regională n 


Secția 1,1 Secția 1,m 


> 


Sectoare de drum Poduri 


Fig. 30 Modelul ierarhic pentru bazele de date 


Aşa cum se poate vedea mai sus, înregistrările din acest model respectă o 
ierarhie strictă. Legăturile dintre diferitele structuri se fac prin pointeri. Un pointer 
este o referință care indică localizarea unor date specifice în mediul de stocare. 
Intuitiv, pointerii sunt precum referintele de pagină în zona de index dintr-o carte. 


Modelul ierarhic a fost prima implementare comercială majoră a conceptelor 
teoretice despre bazele de date. Caracteristica de bază a structurii datelor în acest 
model este prezenţa în percepția utilizatorilor a diferitelor niveluri. Cel mai de sus 
nivel este rădăcina sau părintele. 
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Parcurgerea bazei de date se face respectând calea ierarhică. Pentru a ajunge 
la un anumit segment de date trebuie parcursă întreaga cale de la rădăcină la 
segmentul specific. 


Modelul rețea 


Modelul rețea a fost creat în 1971 de Conferinţa asupra Limbajelor 
Sistemelor de Date (Conference on Data Systems Languages - CODASYL). 
Simplificat, modelul de baze de date reţea este prezentat într-o manieră intuitivă în 
figura următoare: 


ADMINISTRAŢIE 
Sector Rutier q 
SECTIEn i 
Ea Sector Rutier 3 
Cantar Dita N - 
SECŢIEI F Sector Rutier 1 
Angajat m 
Ananint 2 
Ananint 7 
Angajat 1 


Fig. 31 Modelul de baze de date rețea 


Structura de bază în acest model este setul şi se compune din cel puțin două 
tipuri de înregistrări: o înregistrare posesor echivalentă cu părintele din modelul 
ierarhic şi o înregistrare membru. Un membru poate avea mai mulți posesori. 


Modelul de date relational 


Modelul relational a fost dezvoltat in 1970 la IBM de E.F. Codd. La acea 
vreme modelul a fost considerat ingenios dar nepractic. Dezvoltarea ulterioara a 
calculatoarelor ca şi scăderea preţurilor a permis ca acest model să fie utilizat de 
sisteme de baze de date sofisticate: ORACLE, Informix, Ingress etc. 


Structura de bază este tabela. Fiecare tabelă este o matrice formată din linii şi 
coloane. Tabelele sunt referite prin relații. Aceasta înseamnă că tabelele conţin în 
comun unele caracteristici pe baza cărora se pot stabili legături. 
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SECTOR 
COD_SR 


COD_DRUM 
POS_KMI 
INTRETINERE POD KMS 
AN DR_ STRUCT 
COD SR 
INT_COD 
INT_CANTIT 


Fig. 32 Modelul relational de baze de date 


Probabil cea mai simplă formă de abordare a modelului relational rămâne cel 
propus initial de Codd, chiar după rafinări şi dezvoltări succesive. Modelul relational 
specifică o structură de date numită relație şi câteva expresii de manipulare a 
relațiilor. Termenul de relație reprezintă o tabelă, structurată pe linii şi coloane, în 
care se aranjează datele. Nu este obligatoriu ca datele să fie omogene. Pentru relații a 
fost definit şi un set de operaţii denumit algebră relationala care va fi prezentat în 
capitolul următor. 


Consideraţii practice 


Modelele de baze de date au fost utilizate ca fundamente teoretice pentru 
dezvoltarea a bazelor de date şi a sistemelor de gestiune a bazelor de date. În ultima 
perioadă cea mai mare extindere au avut-o bazele de date relationale care au fost 
susţinute puternic de industria informaticii dar şi de utilizatori care au găsit în acest 
model un răspuns simplu la necesitățile lor. 


Este motivul pentru care, în continuare vom dezbate doar problemele legate 
de modele de date relationale, problemele teoretice şi dezvoltarea limbajelor aferente 
insistând pe dezvoltarea limbajului SQL ca standard în domeniul bazelor de date 
relationale. 
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ALGEBRA RELATIONALA SI 
LIMBAJE DE BAZE DE DATE 


5.1. ALGEBRA RELATIONALA 


In cadrul SGBD procesarea datelor se poate face prin limbaje de manipulare a 
datelor (DML). DML pot fi diferite functie de sintaxa lor dar mai ale functie de 
operatiile puse la dispozitie. Aceste operatii, materializate prin definirea unui 
operator, fundamentează complexitatea şi puterea de prelucrare a limbajului. 
Mulțimea operatorilor definiti formează algebra. 


Algebra relațională este un set de operatori definit pe mulţimea relaţiilor şi 
care dau ca rezultat o relație. Prin utilizarea lor se pot defini interogări complicate. 


Se definesc 6 operatori de bază: 
e Proiectia (7), 
e Selecţia (0), 
e Produsul cartezian (x), 
e Uniunea (U), 
e Diferența (—) şi 
e Redenumirea. 
Proiectia 
Proiectia se notează cu 7, a-a (r) unde r este relația asupra căreia se aplică 


operatorul iar a,,a,,:::,a,, reprezintă atribute. Relația rezultată prin aplicarea 


m 
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operatorului de proiecţie are m coloane extrase din relația r. Atributele (coloanele) din 


r care nu sunt enumerate nu se păstrează. Duplicatele nu se retin. 


Al A2 A3 A4 
DN 1 100 345 
DN 12 6 200 
DN 1 78 555 
DJ 105 1 000 
DJ 105 1 780 
DN 1 13 762 
DJ 1 45 300 
Definim proiecția %4 42 (r). Rezultatul operației este: 
Al A2 
DN l 
DN 12 
DJ 105 
DJ l 
Selecția 
Operația de selecție — notată cu op (r) — este 


Exemplu: Se consideră o relație r de forma: 


Op (r) = flís e r), P(s)}. Aplicarea acestui operator va returna o submultime a relatiei 


r care verifică expresia conditionala P. Expresia P se supune regulilor calculului 
propozitional. Mai multe condiții pot fi conectate prin operatori logici (A şi, v sau, 
— nu) 


Exemplu: Pentru relaţia r din exemplul anterior definim O 4)_ py ,.49-1 (r) 


Al A2 A3 A4 
DN 1 100 345 
DN 1 78 555 
DN 1 13 762 
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Produsul cartezian 
Considerând două relații 7, şi 7 se defineşte produsul cartezian 7 xr, ca 
fiind 7 xn, = {pdl pen,qe ry}. Aceasta operatie presupune ca cele doua relatii sunt 


disjuncte (7, A r, =). Dacă nu sunt disjuncte se aplică operaţia de redenumire. 


Exemplu 


Consideram relatia 7, de forma: 


Al A2 A3 A4 
DN 1 100 500 
DN 3 7 333 
DN 50 113 700 


şi n de forma: 


BI B2 B3 
DN 1 E 
DN 3 

DN 50 


produsul lor cartezian este: 


Al A2 A3 A4 BI B2 B3 
DN 1 100 500 DN 1 E 
DN 1 100 500 DN 3 P 
DN 1 100 500 DN 50 S 
DN 3 7 500 DN 1 E 
DN 3 7 333 DN 3 P 
DN 3 7 700 DN 50 S 
DN 50 113 500 DN 1 E 
DN 50 113 333 DN 3 P 
DN 50 113 700 DN 50 S 
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Uniunea 


Operația de uniune (7 Ur,) se defineşte ca r Ur, = f(r en)v(rer, ). 
Relaţiile trebuie să aibă acelaşi număr de atribute şi atributele să fie compatibile. 


Exemplu: Se consideră o relație 7, de forma: 


Al A2 A3 A4 
DN 1 100 345 
DN 12 6 200 
DN 1 78 555 
DN 1 13 762 


şi relația r, de forma: 


Al A2 A3 A4 
DJ 105 1 000 
DJ 105 1 780 
DJ 1 45 300 


uniunea lor r, Ur, are forma: 


Al A2 A3 A4 
DN 1 100 345 
DN 12 6 200 
DN 1 78 555 
DN 1 13 762 
DJ 105 1 000 
DJ 105 1 780 
DJ 1 45 300 


Diferența 

Operația de diferență (7 —r,) se defineşte ca r Ur, = f(r e n)a (r £n jt. 
Relaţiile 7, şi r, trebuie să aibă acelaşi număr de atribute şi atributele trebuie sa fie 
compatibile. 
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Exemplu: Se consideră o relație 7, de forma: 


Al A2 A3 A4 
DN 1 100 345 
DN 12 6 200 
DN 1 78 555 
DN 1 13 762 


şi relația r, de forma: 


Al A2 A3 A4 
DN 12 6 200 
DN 1 13 762 


diferenţa lor 7 — r, are forma: 


Al A2 A3 A4 
DN 1 100 345 
DN 1 78 555 


Pe lângă aceste operații se mai pot defini intersecţia şi îmbinarea (join) care 
însă sunt redundante. De exemplu, intersecţia poate fi definită ca: 
PNO=P-(P-9). Chiar dacă nu sunt strict necesari pentru a face setul de 
operatori să fie complet, aceşti noi operatori, şi alţii asemenea, pot face interogările 
mai simple. 


5.2. LIMBAJUL DE BAZE DE DATE SQL 


SQL (Structured Query Language = Limbaj de Interogare Structurat) este un 
limbaj ataşat unor sisteme de gestiune a bazelor datelor relationale ce se constituie în 
momentul de fata într-o majoritate a preferințelor. 


Modelul relational a apărut în 1970 şi este rodul activităţii lui E.F. Codd ca 
director de cercetări la Centrul IBM din San Jose. Pornind de la acest model au fost 
create mai multe limbaje între care JBM Sequel (evoluat ulterior în Sequel/2), 
System/R, IBM DB2. 


Pe baza experienţei acumulate s-a ajuns la SQL standardizat de ANSI în 


wiwt A 


SQL/92 sau SQL 2. În 1999 se încearcă reglementarea utilizării de obiecte în limbaj şi 
apare SQL/99 sau SQL3. 
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SQL este simultan: 


e un limbaj de definire a datelor, 
e un limbaj de manipulare a datelor si 
e un limbaj de control a datelor. 
Ca limbaj de definire a datelor (în engleză DDL — Data Definition Language, 
în franceză Langage de Definition de Données) SQL poate stabili structura unei baze 
de date şi a tabelelor, o poate modifica sau şterge. 


SQL permite interogarea datelor dintr-o tabelă sau mai multe tabele ale 
bazelor de date relationale. Totodată permite adăugarea, modificarea sau ştergerea 
datelor din tabele. Se poate deci spune că SQL este un limbaj de manipulare a datelor 
(în engleză DML -— Data Manipulation Language, în franceză Langage de 
Manipulation de Données). 


SQL este si un limbaj de control a datelor (în engleză DCL — Data Control 
Language, în franceză Langage de Protection d’Accés). El face posibilă definirea 
diferitelor nivele de acces, gruparea utilizatorilor şi stabilirea permisiunii de a crea, 
interoga şi actualiza datele, tabelele şi baza de date. 


În descrierea limbajului SQL există câteva convenţii pe care este bine să le 
cunoaştem. Astfel, elementele indicate cu majuscule sunt cuvinte cheie. Semnul ,,|” 
indică posibilitatea de alege unul dintre elementele listate. Între paranteze pătrate sunt 
elementele opţionale. Parantezele nu apar efectiv în comandă. 


Sintaxa comenzilor SQL nu este sensibilă la tipul caracterelor şi deci putem 
scrie cu majuscule sau minuscule fără ca aceasta să genereze o eroare. 


Se pot introduce comentarii prin caracterul ,,%” (ce urmează după acest 
caracter până la sfârşitul rândului) sau prin delimitatorii „/*” şi ,,*/” 


5.3. SQL — LIMBAJ DE MANIPULARE A DATELOR 


Această caracteristică a SQL este cea mai căutată şi utilizată. Dacă definirea 
accesului şi privilegiilor în sistem este problema administratorului, dacă în definirea 
de noi tabele sunt implicate persoane specializate, în interogare şi vizualizare sunt 
interesați toți cei care vin în contact cu datele. 


Comanda de bază care caracterizează SQL este SELECT. Cunoaşterea şi 
utilizarea sa pune la dispoziţie un instrument simplu dar puternic de manipulare a 
datelor. 


COMANDA SELECT 
Sintaxa comenzii SELECT 


SELECT este comanda de bază în manipularea datelor. 


71 


Capitolul 5 — Algebra relationala şi limbaje de baze de date 


Această comandă se bazează pe algebra relationala şi are următoarea sintaxă 
fundamentală: 


SELECT [ALL | DISTINCT] <lista numelor de coloane>|* 
FROM <lista tabelelor> 

WHERE <expresie logica de conditionare>] 

ORDER BY < lista numelor de coloane>] 

G 

H 


ROUP BY < lista numelor de coloane>] 
AVING < expresie logica de conditionare >] 


Opţiunea ALL permite vizualizarea tuturor liniilor din interogare şi este 
implicită spre deosebire de DISTINCT care elimină dublurile. Lista numelor de 
coloane este o înşiruire de coloane separate prin virgulă. Dacă se doreşte afişarea 
tuturor coloanelor şi nu există posibilitatea confuziei se poate utiliza semnul * care 
permite acest lucru. 


Lista tabelelor este o înşiruire de nume de tabele din baza de date separate 
prin virgulă. Expresia logică de condiționare este o expresie constituită cu ajutorul 
operatorilor logici şi a comparatorilor matematici şi permite filtrarea acelor linii care 
îndeplinesc condiţia. 


Execuţia comenzii are următorii paşi: se efectuează produsul cartezian al 
liniilor din tabele, se evaluează expresia logică de condiționare, se elimină toate 
elementele care nu îndeplinesc condiţia şi din liniile rămase se returnează coloanele 
indicate în lista numelor de coloane. 


Exemple simple de utilizare a comenzii SELECT 


Presupunând că în baza de date a fost definită o tabelă numită PODURI, 
putem vizualiza toate liniile cu comanda: 


SELECT * FROM Poduri 


In cazul în care suntem interesaţi să urmărim doar numele drumului şi poziţia 
kilometrică a podurilor, considerând că acestea sunt păstrate în coloanele NumeDrum 
şi PozKm, comanda va avea forma: 


SELECT NumeDrum, PozKm FROM Poduri 


De notat că această comandă returnează implicit toate înregistrările din 
tabelă, chiar şi dacă unele dintre ele au fost introduse eronat de mai multe ori. 


Pentru a avea numai o singura dată valorile şi a elimina dublurile adăugăm 
clauza DISTINCT şi comanda ia forma: 


SELECT DISTINCT NumeDrum, PozK FROM Poduri 
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Trebuie ca operaţia să fie privită atent şi precaut pentru că DISTINC 
returnează numai prima linie întâlnită dintre cele similare şi există posibilitatea ca 
tocmai această linie să fie inutilizabilă. 


Operatori în expresia logică de condiționare 


Pentru obținerea numai acelor linii care îndeplinesc o anumită condiţie, în 
clauza WHERE vom utiliza o expresie ce întoarce o valoare logică. Dacă valoarea 
este FALS atunci linia este respinsă de la selecţie. 


Expresia are forma generală a expresiilor logice şi conține: operatori logici 
(AND, OR, NOT), comparatori pe şiruri ??? (IN, BETWEEN, LIKE), comparații 
aritmetice şi pe şiruri de caractere (=, !=, >, <, >=, <=, <>, !>, !<) şi operaţii 
aritmetice şi pe şiruri (+, -, *, /, &, |, ^ ~, %). Ordinea de precedenta este cea 
obişnuită în expresiile logice şi aritmetice dar poate fi modificată prin utilizarea 
parantezelor. 


Exemple de utilizare a comenzii SELECT cu clauza WHERE 


În ultimul exemplu de mai sus presupunem că suntem interesaţi să aflăm 
drumul şi poziţia kilometrică a podurilor care aparțin de un district numit NEGRILA. 


SELECT DISTINCT NumeDrum, Pozkm 
FROM Poduri 
WHERE District = "NEGRILA" 


Dacă suntem interesați să listăm toate podurile care au lungimea mai mare 
decât o lungime minimă atunci comanda va avea forma: 


SELECT * 
FROM Poduri 
WHERE Lungime > 40.0 


Analog, dacă dorim să combinăm condiţiile şi să evidentiem toate podurile 
care aparţin de o listă de districte şi au lăţimea cuprinsă într-un anumit interval: 


SELECT * 

FROM Poduri 

WHERE (District IN("NEGRILA", "ALBILA, "CERNILA") ) 
AND (Latime BETWEEN 6.0 AND 9.0) 


Operatorul LIKE asigura compararea continutului unui sir de caractere prin 
utilizarea unor caractere generice (în engleză “wildcard character”, în franceză 
«caracteres jokers»). Aceste caractere tin locul unei secvenţe de caractere (%), unui 
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singur caracter ( _ ) sau pot indica un interval în care un anumit caracter poate lua 
valori ([-]). 


Exemple de utilizare a caracterelor generice 


”%ogrinzi%” indică orice şir de caractere care conţine în interior cuvântul 
grinzi. Eventuala secvenţă de caractere înlocuită de % poate şi nulă deci şirul poate să 
şi înceapă cu literele indicate în clar. 


” 


____ escu” indica un cuvânt de 7 litere care se încheie cu „escu”. Un astfel 
de cuvânt poate lua valoarea Ionescu, Popescu, Tomescu etc. 


*TA-C]%” indică orice cuvânt care începe cu A, B sau C, inclusiv literele 
însele. 


Ordonarea rezultatelor 


Rezultatele interogării se afişează în conformitate cu poziţia lor în tabele. 
Este totuşi necesar adesea să se stabilească o anumită ordine. Acest lucru se poate 
face utilizând clauza ORDER BY urmată de o listă de coloane separate prin virgulă, 
fiecare dintre ele putând fi urmate de cuvântul cheie ASC (ascendent) sau DESC 
(descendent). Implicit ordonarea se face în ordine ascendentă. 


Exemplu 
SELECT Prenume, Nume, Salariu 
FROM Personal 
ORDER BY Salariu DESC, Nume, Prenume 


Din tabela cu personalul se selectează angajaţii in ordinea descrescătoare a 
salariului. În caz de egalitate înregistrările sunt aranjate în ordinea alfabetică a 
numelor şi prenumelor. ORDER BY ordonează după valori numerice, alfanumerice 
sau combinaţii. 


Gruparea rezultatelor 


Uneori este important ca operaţiile şi afişarea rezultatelor să se facă pe grup 
de înregistrări. Aceste operații sunt permise de includerea în comandă a clauzei 
GROUP BY. Funcţiile utilizabile în astfel de situaţii dau o imagine statistică a 
grupurilor. Funcţiile agregate ce pot fi utilizate sunt: AVG() pentru calculul mediei, 
COUNT() care numără liniile din grup, MAX(Q şi MINO care aleg maximul respectiv 
minimul selecţiei, SUM() care calculează suma şi STD() sau STDDEV() pentru 
calculul deviatiei standard (ultima funcţie este o extensie a limbajului şi depinde de 
implementare). 
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Exemplu 

SELECT Sectie, COUNT (*), AVG(Salariu), 
ax (Salariu), SUM(Realizari) 
FROM Personal 

ORDER BY Sectie 

GROUP BY Sectie 


Se grupează înregistrările angajaților din fiecare secţie şi se afişează numele 
secției, numărul angajaţilor, media şi maximul salarial precum şi suma realizărilor. 


Lucrul cu jonctiuni 


Exemplele de interogare de mai sus au fost date pentru lucrul cu o singură 
tabelă. Totuşi sintaxa clauzei FROM este: 


FROM <lista tabelelor> 
permiţând includerea numelui mai multor tabele simultan. 


Pentru a simplifica structura tabelelor şi a minimiza spațiul utilizat, datele 
trebuie stocate convenabil în mai multe tabele. În momentul utilizării datele din tabele 
trebuie combinate. Acest lucru este posibil prin utilizarea jonctiunilor. 


Jonctiunea se realizează prin efectuarea produsului cartezian al tabelelor 
implicate în ordinea precizată de clauza ORDER BY. Clauza WHERE elimină toate 
elementele produsului cartezian care nu îndeplinesc expresia logică de condiționare. 
Deoarece în două tabele diferite pot apare coloane cu acelaşi nume se identifică unic 
fiecare coloană prin indicarea numelui tabelei urmat de caracterul ”.” urmat de 
numele coloanei. 


Acest tip de joncțiune este opţiunea naturală şi se numeşte joncțiune interna 
(inner join). 


Daca alegerea prin clauza WHERE se face prin verificarea egalitatii a doua 
coloane atunci joncţiunea poartă numele de echi-jonctiune (jonctiune echivalentă). 


Exemplu 
SELECT NumeDrum, PozKm, NumeDistr 
FROM Poduri, District 
WHERE Poduri.CodDistr = District.CodDistr 


Dacă însă alegerea prin clauza WHERE se face prin verificarea unei 
inegalităţi între coloane sau combinaţii de coloane atunci joncțiunea poartă numele 
de non-echi-jonctiune (joncțiune neechivalentă). 
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Jonctiuni externe 


O joncțiune externă este o joncțiune în care fiecare înregistrare 
corespunzătoare din cele două tabele este inclusă într-o înregistrare rezultat chiar dacă 
nu îndeplineşte condiţiile. Asemenea înregistrare va furniza coloane cu conţinut 
NULL. 


Jonctiunea externă stânga 

Jonctiunea externă stânga sau simplu joncțiunea stânga include liniile din 
prima tabelă a unei jonctiuni (cea din stânga) chiar dacă nu satisfac condiția impusă. 
Exemplu: 


SELECT INSPECT.*, DEFECT. * 
FROM INSPECT LEFT JOIN DEFECT 
ON INSPECT.ID = DEFECT.ID INSPECT; 


Jonctiunea externa dreapta 

Jonctiunea externa dreapta sau jonctiunea dreapta include liniile din a doua 
tabelă a unei jonctiuni (cea din dreapta) chiar dacă nu satisfac condiţia impusă. 
Exemplu: 


SELECT INSPECT.*, DEFECT. * 
FROM INSPECT RIGHT JOIN DEFECT 
ON INSPECT.ID = DEFECT.ID INSPECT; 


Utilizarea interogarilor imbricate 


În cadrul unei clauze se poate utiliza o singură valoare. Uneori este nevoie a 
se utiliza mai multe valori care să fie preluate din tabel. Pentru generarea acestor 
valori se poate utiliza o nouă interogare. Interogările imbricate se numesc sub- 
interogări. Acest mod de lucru se mai numeşte interogare în cascadă deoarece se 
aşteaptă încheierea unei interogări pentru a începe o alta. 


Sub-interogările trebuie plasate într-o clauză WHERE sau HAVING unde 
înlocuieşte o constantă sau un grup de constante care intră într-o relație. 


Când înlocuieşte o constantă sub-interogarea trebuie să întoarcă o singură 
valoare (o tabelă cu o singură linie şi o singură coloană): 


SELECT --- 
FROM --- 
WHERE --- < ( 
SELECT --- FROM --- 
) 
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Când înlocuieşte un grup de constante incluse într-o expresie care conţine 
operatorii IN, EXISTS, ALL, ANY sub-interogarea trebuie să întoarcă un set de 
valori cu o singură dimensiune: 


SELECT --- 

FROM. === 

WHERE --- IN ( 
SELECT === FROM === 
) 


Interogările imbricate respectă toate regulile de sintaxă şi de logică ale 
comenzii SELECT şi pot avea la rândul lor sub-interogari.. 


Exemplu 


Presupunând că în tabela Poduri avem coloana IndStare de tip numeric în 
care se stochează un indicator de stare tehnică. Cu următoarea comandă vom afişa 
toate podurile la care indicele de stare este sub medie. 


SELECT * 
FROM Poduri 
WHERE IndStare < 


SELECT AVG(IndStare) FROM Poduri 


OPERATII DE ASAMBLARE 


Rezultatul comenzilor de interogare poate fi combinat utilizând operațiile 
definite de algebra relațională. Aceste operaţii se efectuează între două comenzi 
SELECT. Operatorii sunt UNION, INTERSECT şi EXCEPT. 


Operatorul UNION 


Operatorul UNION realizează reuniunea setului de tuple generate ca rezultat 
a două comenzi SELECT. Sintaxa are forma: 


SELECT === 
UNION [ALL] 
SELECT === 


Comenzile SELECT respectă sintaxa şi regulile generale prezentate anterior. 
Implicit dublurile se elimină. Pentru a afişa toate liniile se va utiliza clauza UNION 
ALL. 
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Exemplu 


Pentru a prezenta o listă completă a adreselor complete a tuturor unităților din 
administrație. Datele sunt păstrate în două tabele Directii şi Sectii. Pe fiecare dintre 
cele două tabele se execută o interogare care are ca rezultat coloanele Denumire, 
Adresa, Telefon. Rezultatele sunt reunite prin operatorul UNION. Comanda completă 
este: 


SELECT Denumire, Adresa, Telefon 
FROM Sectii 

UNION 

SELECT Denumire, Adresa, Telefon 
FROM Districte 


Operatorul INTERSECT 


Operatorul INTERSECT realizează operaţia de intersectare a seturilor de 
tuple generate ca rezultat a două comenzi SELECT. Sintaxa are forma: 


SELECT --- 
NTERSECT 
SELECT --- 


Comenzile SELECT respectă sintaxa şi regulile generale prezentate anterior. 
Ambele trebuie să aibă aceeaşi schemă. Nu este o comandă standard şi nu este 
implementată de toate SGBDR. Nu este un operator necesar. Poate fi înlocuit prin 
comenzi SELECT imbricate, de exemplu operaţia: 


SELECT al,bl FROM Tabelal 


NTERSECT 
SELECT a2,b2 FROM Tabela2 


poate fi inlocuita prin: 


SELECT al,bl FROM Tabelal 
WHERE EXISTS ( SELECT a2,b2 FROM Tabela? 
WHERE al=a2 AND bl=b2 ) 


Operatorul EXCEPT 


Operatorul EXCEPT realizează operația de diferență a seturilor de tuple 
generate ca rezultat a două comenzi SELECT, adică se păstrează numai acele linii 
care fac parte din primul set dar nu fac parte din cel de-al doilea. 
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Sintaxa are forma: 


SELECT === 
NTERSECT 
SELECT --- 


Comenzile SELECT respecta sintaxa $i regulile generale prezentate anterior. 
Ambele trebuie să aibă aceeaşi schema. Nu este o comandă standard şi nu este 
implementată de toate SGBDR. Nu este un operator absolut necesar. Poate fi înlocuit 
prin comenzi SELECT imbricate, de exemplu operația: 


SELECT al,bl FROM Tabelal 
EXCEPT 
SELECT a2,b2 FROM Tabela2 


poate fi inlocuita prin: 
SELECT al,bl FROM Tabelal 


WHERE NOT EXISTS (SELECT a2,b2 FROM Tabela2 
WHERE al=a2 AND bl=b2 ) 


ADĂUGAREA DE DATE ÎNTR-O TABELĂ 

SQL permite utilizarea comenzii INSERT pentru adăugarea de noi linii într-o 
tabelă fie direct prin impunerea valorilor de către utilizator (clauza VALUES), fie 
prin preluarea lor dintr-o interogare (clauza SELECT). 


Adăugarea de linii prin valoare 


Introducerea de noi linii se face prin comanda INSERT şi specificarea tabelei 
destinație prin clauza INTO la care se specifică valorile efective prin clauza VALUES 
astfel: 


NSERT INTO NumeTabela 
(coloanal,coloana2,coloana3,...) 
VALUES (valoarel,valoare2,valoare3,... ) 


Se adaugă o singură linie. Valorile trecute in clauza VALUES sunt atribuite 
fiecărei coloane în ordinea enumerării. Coloanele care nu sunt cuprinse în listă 
primesc valoarea NULL. 


Dacă o coloană nu poate rămâne nulă atunci se generează o eroare. Valorile 
trebuie să fie compatibile cu tipul declarat al coloanei. 
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Dacă într-o coloană se acceptă doar valoare unică (clauza UNIQUE la creare) 
şi se adaugă o valoare deja existentă se generează o eroare. 


Adăugarea de linii obținute dintr-o interogare 


Introducerea de noi linii se face prin comanda INSERT şi specificarea tabelei 
destinaţie prin clauza INTO la care se adaugă o clauza SELECT: 


NSERT INTO NumeTabela 
(coloanal,coloana2,coloana3,...) 
SELECT Coll, Col2, Col3, 

FROM NumeTabel2 

WHERE <expresie logică de conditionare> 


Se adaugă numai una, mai multe sau nici o linie funcție de îndeplinirea 
condiţiei ataşate clauzei WHERE. 


Dacă într-o coloană se acceptă doar valoare unică (clauza UNIQUE la creare) 
şi se adaugă o valoare deja existentă se generează o eroare. 


Se respectă aceleaşi reguli ca la adăugarea de linii prin valoare. Atribuirea 
valorilor se face în ordinea în care au fost incluse în listă. Nu este obligatoriu ca o 
coloană din lista clauzei SELECT să aibă acelaşi nume cu coloana corespunzătoare 
din lista clauzei INTO. În lista de coloane inclusă în clauza SELECT nu trebuie să 
apară coloane din tabela NumeTabela. 


Exemple 


1. Adăugarea unei linii prin declararea explicită a valoarilor: 


NSERI 
INTO Poduri ( NumeDrum, PozKm, Obstacol, 
Lungime, Latime, District) 
VALUES ( "DN870", 89.779, "Râul Repedea", 


167.78, 12.40, "NEGRILA" ) 


2. Adaugarea unei linii cu valori obtinute dintr-o interogare 


NSERT 
INTO ManvP( Drum, Km, Obstacol, 
LungPOD, LatPod, District) 
SELECT NumeDrum, PozkKm, Obstacol, 
Lungime, Latime, District 
FROM Poduri 
WHERE District IN("NEGRILA", "ALBILA, "CERNILA") 
AND (Lungime > 10.0) 


80 


Baze de date şi algoritmi pentru căi de comunicaţie 


MODIFICAREA DATELOR DINTR-O TABELĂ 


Datele deja introduse într-o tabelă pot fi modificate atunci când condiţiile o 
cer. Pentru aceasta standardul SQL a definit comanda UPDATE. Aceasta are sintaxa: 


UPDAT! 


NumeTabela 

T Coloanal = valoarel 
[, Coloana? = valoare? |] 
[, Coloana3 = valoare3 |] 
RETARA 


WHERE <expresie logică de conditionare> 


FY 
H 


GI 


Operatia de modificare se efectuează în tabela NumeTabela, fiecăreia dintre 
coloanele specificate în clauza SET i se atribuie valoarea de după semnul "=". 
Valoarea ce se atribuie poate să provină şi din evaluarea unei expresii deci fiecare 
linie poate primi un set deosebit de valori pentru coloanele specificate. Atribuirea se 
aplică numai acelor linii care îndeplinesc expresia logică de condiționare din clauza 
WHERE. 


Exemplu 
UPDATE Poduri 
SET District = "FRUMUSENI" 
WHERE (District ="NEGRILA") and 
(NumeDrum = "DN870") and 


(PokKm<= 109.543) 


Când un anumit sector de drum a fost transferat între două districte şi 
simultan lucrările de artă aferente trec din administrarea unui district în a celuilalt se 
poate actualiza conţinutul coloanei District în tabela Poduri. 


ELIMINAREA DATELOR DINTR-O TABELĂ 


Când anumite date înregistrate în liniile tabelelor devin inutile ele pot fi şterse 
pentru a nu încărca inutil spaţiul rezervat bazei de date şi pentru a nu complica 
comenzile de interogare. 


Pentru aceasta SQL oferă comanda DELETE cu următoarea sintaxă: 


DELETE FROM NumeTabela 
WHERE <expresie logică de conditionare> 


Comanda DELETE are clauzele FROM pentru a indica numele tabelei în care 
se execută operaţia şi WHERE pentru a face selecția liniilor care se elimină. 
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Exemplu 


După ce un sector de drum a fost trecut dintr-o categorie în alta, lucrările de 
artă aferente nu se mai află în administrarea instituţiei care posedă baza de date. Din 
considerente istorice se pot păstra datele în arhive, ceea ce presupune un transfer 
utilizând comanda INSERT, dar datele despre fiecare în parte se şterg din tabela de 
gestiune curentă. Pentru aceasta utilizăm o comandă DELETE de forma: 


DELETE FROM Poduri 
WHERE (NumeDrum="DN8 70") and (PokKm<=109.855) 


FUNCȚII UTILIZATE ÎN INTEROGĂRI 


În realizarea interogărilor se utilizează, pe lângă funcţiile agregate, şi a 
operatorilor aritmetici un număr de funcţii matematice care asigură prelucrarea 
corectă a datelor. Aceste funcţii nu sunt standard şi diferă de la implementare la 
implementare. Totuşi câteva se regăsesc în majoritatea variantelor SQL. Prezentăm 
mai jos aceste funcţii cu precizarea că înainte de a le folosi trebuie să verificăm în 
documentaţia aflată la dispoziţie prezenţa şi sintaxa lor exactă. 


Tabelul 2 Funcţii matematice utilizate în SOL 


Funcţia Descriere 

ABS(X) Valoarea absolută a numărului real X 

CEIL(X) X is a decimal value that will be rounded up. 
FLOOR(X) X is a decimal value that will be rounded down. 
GREATEST(X,Y) | Valoarea ce mai mare dintre X şi Y 

LEAST(X,Y) Valoarea cea mai mica dintre X si Y 

MOD(X,Y) Restul împărțirii întregi a valorilor X si Y (X modulo Y) 
POWER(X,Y) Returnează X la puterea Y 
TA oa 
SIGN(X) Semnul valorii X 

SQRT(X) Rădăcina pătrată a valorii X 


Pe lângă acestea se utilizează şi funcții de procesare a şirurilor de caractere. 
Similar celor matematice aceste funcții nu sunt standard şi trebuie verificată sintaxa 
lor exactă. 
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Tabelul 3 Funcţii de manipularea şirurilor de caractere 


LEFT(<şir>,X) Returnează X caractere din stânga şirului de caractere 
RIGHT(<şir>,X) Returnează X caractere din dreapta şirului de caractere 
UPPER(<şir>) Converteşte caracterele şirului în majuscule 
LOWER(<şir>) Converteşte caracterele şirului în minuscule 
INITCAP(<sir>) Converteste inceputul propozitiilor in majuscule 
LENGTH {<sir>) Returneaza lungimea şirului de caractere 


Concatenează conţinutul celor două şiruri în ordinea 
aleasă 

Adaugă la stânga şirului numărul necesar de caractere 
cuprinse între apostrof pentru a ajunge la lungimea X 
Adaugă la dreapta şirului numărul necesar de caractere 
cuprinse între apostrof pentru a ajunge la lungimea X 
Extrage din şir Y litere începând cu poziţia Y 

Pentru valorile NULL ale coloanei co/ returnează 
valoarea val, altfel returnează valoarea coloanei 


<sir1>||<sir2> 


LPAD(<sir>,X,'*') 


RPAD(<sir>,X,'*") 
SUBSTR(<sir>,X, Y) 
NVL(<col>,<val>) 


În afara acestor funcții există şi altele specifice fiecărei implementări. Pentru 
lista completă şi sintaxa corectă trebuie studiată documentaţia care se livrează la 
cumpărarea pachetelor software. 


5.4. SQL — LIMBAJ DE DEFINIRE A DATELOR 


CREAREA TABELELOR 

SQL permite definirea de tabele noi. Acest lucru asigură flexibilitate în 
procesare şi posibilitatea de dezvoltare a aplicațiilor prin lărgirea tipului şi cantității 
de date stocate. 


Comanda specifică pentru adăugarea de tabele în baza de date este 
„CREATE TABLE”. Prin această comandă se specifică numele tabelei care se 
creează, numele, tipul şi caracteristicile coloanelor care i se ataşează. 


Sintaxa comenzii CREATE TABLE 


CREATE TABLE NumeTab 
(NumeColl TipDeDate [NOT NULL] [UNIQUE | NDEX], 
NumeCol2 TipDeDate [NOT NULL] [UNIQUE | NDEX], 
NumeCol3 TipDeDate [NOT NULL] [UNIQUE | INDEX], 


) 


Trebuie sa existe cel putin un nume de coloana in lista. Numele de coloana 
trebuie să respecte regulile generale din SQL care seamănă cu regulile din alte 
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limbaje. Un nume începe obligatoriu cu o literă. Într-o tabelă pot exista maximum 254 
de coloane. Fiecare coloană specificată are un anumit tip de date. Opţiunea NOT 
NULL, situată după fiecare declarare de tip, precizează obligativitatea atribuirii unei 
valori la inserare, editare, modificare pentru coloana corespunzătoare. 


În zona de opţiuni a descrierii coloanei poate apare şi clauza DEFAULT care 
este prezentată mai jos. 
Crearea de tabele cu copierea datelor 


Este posibil ca la crearea unui tabele să se adauge date ce pot fi preluate din 
alte tabele. Sintaxa comenzii de creare este: 


CREATE TABLE 
NumeTabel (Coloanal TipColoanal, 
Coloana? TipColoana2, 

Coloana3 TipColoana3, 


) 
AS SELECT NumeCamp1,NumeCamp2,NumeCamp3,... 
FROM NumeTabel2 
[WHERE <expresie logica de conditionare>] 


În comandă trebuie să fie inclusă cel putin o definiție de coloană si, 
corespunzător, o definiţie de câmp în clauza AS SELECT. 
Tipuri de date în tabelele bazelor de date 


Tipul de date declarat pentru fiecare coloană trebuie să fie din lista de tipuri 
acceptate de fiecare implementare in parte. Conform ANSI/ISO tipurile de date 
pentru coloane sunt prezentate în tabelul următor. 


Tabelul 4. Tipuri de date definite de ANSI / ISO 


Tip Descriere 

CHAR[(n)] Şir de caractere cu lungime fixă 

VARCHAR[(n)] Şir de caractere cu lungime variabilă 
NUMBER[(n,[d])] Număr pe de n cifre [opţional d cifre după virgulă] 
SMALLINT Întreg pe 16 biti (-32768 la 32757) 

INTEGER Intreg pe 32 de biti (-2E31 la 2E31-1) 
FLOAT[(n)] Număr în virgulă mobilă 

DOUBLE PRECISION | Număr real dublă precizie 

DATE Date de tipul dată 
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Pe lângă acestea există multe alte tipuri care au fost definite numai în câteva 
implementări. Unele dintre cele mai întâlnite sunt TIME care stochează ora în 
formatul 12:59:59.99 şi TIMESTAMP care stochează data şi ora. 


Respectând în linii mari prescriptiile ANSI/ISO fiecare implementare a 
încercat să satisfacă nevoilor specifice cărora trebuie să le răspundă. 


Ca un exemplu Oracle”? suportă următoare tipuri: 


Tabelul 5. Tipuri de date suportate de Personal Oracle7 


Tip Descriere 
Şiruri de caractere cu lungimea între 1 şi 255. La şirurile mai 
CHAR É A 
scurte se adaugă spații la dreapta. 
DATE Include anul, luna, ziua, ora minutul şi secunda. 
LONG Sir de caractere cu lungime variabilă de pana la 2Gigaocteti. 


LONG RAW | Date binare de până la 2 Gigaocteti. 
NUMBER Date numerice. 
RAW Date binare de până la 255 de octeți. 


ROWID Valoare hexazecimală reprezentând o adresă unică a liniei. 


VARCHAR2 | Şir de lungime variabilă până la 2000 de caractere. 


Note: 
1. Tipul LONG mai este numit şi MEMO în alte sisteme de gestiune. Se 


foloseşte pentru stocarea de texte foarte lungi. 


2. Tipul LONG RAW mai este numit şi BLOB (Binary Large OBject). 
Poate servi pentru stocarea de date reprezentate binar precum 
fotografii, grafice, sunet, imagini în mişcare etc. Acest tip de 

date este cel mai des utilizat în sistemele multimedia. 
Tipurile de date şi structura lor evoluează. Ele devin tot mai complexe pe 
măsură ce noi concepte apar în informatică. În setul standard se includ tipuri de date 
mulțime, tablouri de date, date de tip obiecte grafice, posibilitatea ca utilizatorul să-şi 


definească propriile structuri şi tipuri de date care să poată fi utilizate ulterior pentru 
stocare. 


Un exemplu este dat de evoluția tipurilor standard de date definite pentru 
SQL99 comparativ cu tipurile de date definite în standardele anterioare. 
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SQL99 
Tipuri de date 
1 
| | | | 
bed ; ms nonini 0 Structuri de date Tipuri de definite 
Tipuri predefinite Tipuri referință Tablouri de date ROW Jebha; 
| | | | 
Numeric Şiruri de caractere DataTimp Interval Boolean 
— Exacte — Date 
L_,! Aproximative Ll Time 
L_»| TimeStamp 
1 i Li 
Bit Caracter Blob 
; Mai i Fix 
Fix La Variabil 


L Variabil 


L CLOB 


Fig. 33 Tipuri de date în SQL 1999 


Exemple de tipuri de date implementate în diferite versiuni de SQL sunt 
numeroase dar ne-am limitat la cele mai cunoscute. Pentru implementarea exactă se 
vor studia manualele de referință sau documentația furnizată de producător ce 
însoţeşte pachetele de instalare la cumpărare. 


Expresii de restricție 


Expresiile de restricție sunt clauze ce forțează valorile introduse de utilizator 
într-o coloană să respecte anumite reguli. 
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Aceste reguli se definesc la crearea tabelei cu ajutorul unor cuvinte cheie 
listate în continuare: 


e DEFAULT 
e NOT NULL 
e UNIQUE 

e CHECK 


Regulile introduse prin aceste clauze au efect pe toată durata existenţei tabelei 
sau până când tabela este alterată. 


Definirea valorii implicite 
Dacă pentru unul dintre câmpurile dintr-o înregistrare nu se introduce nici o 


valoare, SQL permite asocierea unei valori implicite. Aceasta se realizează cu clauza 
DEFAULT. Cuvântul cheie DEFAULT trebuie să fie urmat de: 


e O constantă numerică; 

e O valoare sir de caractere; 

e Cuvântul cheie USER (numele utilizatorului); 

e Cuvântul cheie NULL; 

e Cuvântul cheie CURRENT_DATE (data introducerii); 

e Cuvântul cheie CURRENT_TIME (ora introducerii); 

e Cuvântul cheie CURRENT_TIMESTAMP (data şi ora introducerii); 


La crearea unei noi înregistrări se asignează automat valoare ataşată clauzei 
DEFAULT. Prin aceasta ne putem asigura că un câmp nu este niciodată gol. 


Impunerea introducerii unei valori 

Clauza NOT NULL impune ca la editarea unui câmp să se introducă 
obligatoriu o valoare pentru un câmp. Dacă acest câmp este gol atunci sistemul nu 
permite salvarea înregistrării. 


Verificarea unicitatii 


Clauza UNIQUE permite verificarea faptului că valoarea unui câmp nu există 
deja în tabelă. Aceasta garantează că toate valorile din câmp sunt diferite. 


Verificarea unei condiții 


SQL permite ca la introducerea unei valori într-un câmp să se facă o 
verificare a unei condiții logice. Aceasta se va face cu clauza 
CHECK (<expresie logica>). Sistemul evaluează expresia logică şi dacă aceasta nu se 
verifică atunci valoarea nu se acceptă. 


Expresia logică are acelaşi format ca expresia ataşată clauzei WHERE din 
comanda SELECT. 
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Exemplu de utilizarea a restricţiilor 


Prezentăm în continuare un exemplu de creare a unei tabele prin comanda 
CREATE TABLE în care se utilizează clauzele de restricţie. 


CREATE TABLE Pod ( 
ID char (9) NOT NULL UNIQUE 
TipDrum char(2) NOT NULL DEFAULT "DN", 
Drum char (4) NOT NULL, 
Km integer (3) CHECK (Km>0), 
M integer (3) CHECK (M>0) 
AnContr integer check (AnConstr > 1850) 


) 


CREAREA UNEI VIZIUNI 


In viata reală, fiecare poate avea propria imagine despre elementele lumii 
înconjurătoare. Această imagine poate fi descrisă in conformitate cu propriile 
concepte, din perspectivă proprie. Această reprezentare proprie poartă numele de 
viziune (“view” în engleză, « vue » în franceză; în limba română s-a mai utilizat 
termenul de ,,vedere” şi de „relaţie virtuală”) 


În SQL o viziune este o tabelă virtuală. Datele pot proveni din mai multe 
tabele şi sunt grupate în conformitate cu reprezentarea dorită de utilizator. Fiecare 
utilizator al sistemului SQL îşi poate crea o viziune proprie asupra datelor din baza de 
date. Datele din diferite tabele pot fi combinate după dorinţă într-o unitate logică 
astfel încât în continuare ele să apară ca un tot unitar, virtual într-o singură tabelă. 


Această operaţie se realizează utilizând comanda CREATE VIEW a cărei 
sintaxă este următoarea: 


CREATE VIEW NumeViziune (Coloanal,Coloana2,Coloana3,...) 
AS SELECT 


Clauza AS SELECT este urmata de toate optiunile normale ale comenzii 
SELECT (vezi). Este, in fapt, declararea formala a unei comenzi SELECT si atasarea 
unui nume, astfel încât ori de câte ori dorim să repetăm acea comandă să nu mai fie 
nevoie să scriem toate liniile, clauzele şi opțiunile. 


O formă uzuală, dar nu singura, poate fi: 


CREATE VIEW Viziunel (Coloanal,Coloana2,Coloana3) 
AS SELECT Aliasl.Coll,Alias1l.Col2,Alias2.Col3 
FROM Tabelal Aliasl, Tabela2 Alias2 
WHERE (Aliasl.Col2=Alias2.Col1X) 
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In continuare rezultatul interogării va fi privit ca o tabelă care poate fi, la 
rândul ei, utilizată în comenzi de interogare. 


Utilitatea viziunilor rezidă în faptul că acestea se constituie într-un fel de 
interfaţă între baza de date şi utilizator. 


Utilizarea viziunilor are avantaje multiple, între care: 


e Afişează o selecție convenabilă din baza de date, 

e Restrictioneza accesul altor utilizatori, asigurând o securitate sporită, 

e Grupează informaţiile care sunt privite ca o singură entitate, chiar daca ele 
provin din tabele diferite. 


CREAREA ŞI UTILIZAREA INDECŞILOR 


Un index este un auxiliar care facilitează accesul la baza de date în condiţiile 
sortării elementelor. Un index nu este absolut necesar, există mecanisme de sortare şi 
acces independente, dar ajută la economisirea timpului de execuție a comenzilor de 
căutare, selecție şi ordonare. Totuşi, reversul este prelungirea unora dintre comenzile 
de adăugare şi modificare de date. De aceea este necesar ca utilizarea unui index să 
fie bine gândită şi justificată prin balanţa avantajelor şi dezavantajelor. Este necesar a 
se evita în baza de date dublurile care sunt, în SQL, destul de complicat de tratat. 
Unele sisteme rezolvă această problemă prin crearea automată a unui câmp 
suplimentar cu valoare unică asupra căruia se defineşte o cheie primară. 


Crearea unui index se face în SQL prin comanda CREATE INDEX. Aceasta 
are sintaxa următoare: 


CREATE [UNIQUE] INDEX Numelndex 


ON NumeTabela 
(Campl [ASC/DESC], sară 7) 


Opţiunea UNIQUE permite eliminarea dublurilor. Absența acestei clauze 
permite prezenţa tuturor liniilor. Opţiunea ASC/DESC defineşte ordinea ascendentă 
sau descendentă a valorilor în coloane. Implicit ordinea este ascendentă. 


MODIFICAREA TABELELOR ŞI A BAZEI DE DATE 


Într-o bază de date este posibil să se elimine sau să se modifice tabelele, 
indecşii şi viziunile. Pentru tabelele deja create se poate modifica structura sau se 
poate schimba numele. Se pot adăuga coloane, şterge coloane sau se poate modifica 
tipul datelor stocate într-o coloană. 
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Ştergerea componentelor bazei de date 


Se poate renunţa la prezenţa unor tabele, indecsi şi viziuni atunci când acestea 
devin inutile. Pentru aceasta se utilizează comanda DROP. Această comandă trebuie 
bine gândită înainte de a fi utilizată pentru că efectele sale sunt definitive şi 
ireversibile. 


Sintaxa pentru ştergerea unui tabele este: 


DROP TABLE NumeTabela 


Sintaxa pentru ştergerea unui index este: 


DROP INDEX Numelndex 


Sintaxa pentru ştergerea unei viziuni este: 


DROP VIEW NumeViziune 


Ştergerea datelor dintr-o tabelă 


Comanda DROP TABLE presupune ştergerea datelor şi eliminarea tabelei în 
totalitate. Dacă, însă, dorim să păstrăm tabela cu structura anterioară şi să eliminăm 
numai datele care nu ne mai sunt necesare atunci putem să utilizăm comanda 
TRUNCATE. Sintaxa comenzii este: 


TRUNCAT 


T 


TABLE NumeTabela 


Redenumirea unei tabele 


Dacă se doreşte păstrarea datelor si a tabelei dar schimbarea numelui tabelei 
se poate utiliza comanda RENAME. Sintaxa comenzii este: 


RENAME NumeVechi TO NumeNou 


Unele sisteme de gestiune a datelor nu implementează această comandă. Este 
necesar a se face o documentare adecvată înainte de utilizarea comenzii. 


Eliminarea unor coloane dintr-o tabelă 


Dacă se doreşte modificarea structurii unei tabele în sensul ştergerii unei 
coloane se va utiliza comanda ALTER cu clauza DROP COLUMN. Sintaxa comenzii 
este: 
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ALTER TABLE NumeTabela 
DROP COLUMN NumeColoana 


Înainte ca să executăm această comandă trebuie să verificăm dacă respectiva 
coloană face parte dintr-o viziune, dintr-un index, sau dacă este obiectul unei 
verificări de integritate. Când una dintre aceste stări este îndeplinită comanda de 
ştergere nu se execută şi se generează o eroare. 


Adăugarea unei coloane într-o tabelă 


Se poate adăuga o coloană nouă într-o tabelă utilizând comanda ALTER 
TABEL cu clauza ADD. Sintaxa comenzii este: 


ALTER TABLE NumeTabela 
ADD NumeColoana TipDate 


Modificarea unei coloane 


Modificarea declaraţiei unei coloane dintr-o tabelă se face utilizând comanda 
ALTER TABEL cu clauza MODIFY. 


Sintaxa comenzii ALTER TABLE este: 


ALTER TABLE NumeTabela 
MODIFY NumeColoana TipDate 


Unele implementări au înlocuit clauza MODIFY cu clauza ALTER 
COLUMN restul comenzii rămânând identic. 


5.5. SQL — LIMBAJ DE CONTROL A DATELOR 


Mai multi utilizatori pot accesa simultan o bază de date. Fiecare dintre aceştia 
pot avea necesităţi diferite. Unii pot şi trebuie să modifice datele, alţii trebuie numai 
să le citească. Pe baza necesităţilor se pot defini drepturile acordate fiecărei persoane 
care accesează baza de date. 


Standardul SQL permite definirea drepturilor de acces cu ajutorul clauzelor: 


e GRANT pentru acordarea de drepturi, şi 
e REVOKE pentru retragerea drepturilor. 


Aceste drepturi denumite şi privilegii sunt: 


e DELETE — pentru ştergerea de date; 
e INSERT — pentru adăugarea de noi înregistrări; 
e UPDATE — pentru actualizarea datelor. 
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e SELECT -— pentru citirea datelor; 


Utilizatorul care a creat un tabel, viziune sau index poate acorda sau retrage 
privilegiile asupra entității în cauză. Aceste drepturi pot fi retransmise dacă se 
specifică astfel. 


ATRIBUIREA PRIVILEGIILOR 


Prin comanda GRANT se pot acorda privilegii unuia sau mai multor 
utilizatori asupra unui sau mai multor elemente din baza de date. 


Comanda GRANT are formatul: 


GRANT <listă de drepturi> 
ON <listă de componente> 
TO <listă de utilizatori> 
[WITH GRANT OPTION] 


Lista de drepturi poate fi înlocuită cu cuvântul cheie ALL şi se acordă toate 
privilegiile. Privilegiile acordate pentru o tabelă pot fi limitate la un număr de coloane 
prin asocierea listei de coloane la lista de drepturi. În locul listei de utilizatori se poate 
utiliza cuvântul cheie PUBLIC şi privilegiile acordate se transmit tuturor 
utilizatorilor. 


Clauza WITH GRANT OPTION autorizează utilizatorii să transmită mai 
departe privilegiile primite prin comanda în curs. 
Exemplu: 
GRANT UPDATE (Defecte, Comentarii) 
ON Inspect 
TO InsPod03 
WITH GRANI OPTION 


RETRAGEREA PRIVILEGIILOR 


Dacă drepturile acordate nu mai sunt necesare, ele pot fi retrase. Comanda 
REVOKE asigură retragere drepturilor unui utilizator. 


REVOKE 


[GRANT OPTION FOR] <listă de drepturi> 
ON <lista de componente> 
FROM <listă de utilizatori> 
Clauza WITH GRANT OPTION retrage utilizatorilor dreptul de a transmite 
mai departe privilegiile primite prin comanda GRANT. 


Lista de drepturi poate fi înlocuită cu cuvântul cheie ALL şi se retrag toate 
privilegiile. Privilegiile retrase pentru o tabelă pot fi limitate la un număr de coloane 
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prin asocierea listei de coloane la lista de drepturi. În locul listei de utilizatori se poate 
utiliza cuvântul cheie PUBLIC şi privilegiile se retrag tuturor utilizatorilor. 


CONTROLUL TRANZACŢIILOR 


Sistemele de gestiune a bazelor de date trebuie să ofere mecanisme de 
asigurarea a consistentei datelor. 


De exemplu, dacă se şterge o înregistrare dintr-o tabelă de inspecții trebuie să 
se şteargă şi înregistrările corespunzătoare dintr-o tabelă cu defectele constatate în 
timpul inspecției. Totodată, dacă se introduce o valoare de apreciere pentru un defect 
atunci trebuie să se reevalueze starea tehnică. Toate acestea şi multe altele se fac 
automat prin controlul tranzacţiilor. 


Un astfel de mecanism de control al tranzacţiilor se numeşte în SQL trigger 
(declanşator). 


Trigerii sunt funcţii a căror acţiune este inițiată de evenimente care apar în 
sistem. Se pot urmări patru categorii de evenimente: 


e Crearea unei noi înregistrări; 

e Ştergerea unei înregistrări existente; 

e Actualizarea unei înregistrări existente; 
e Citirea unei înregistrări existente. 


Ultimul dintre evenimente este mai rar utilizat şi de aceea uneori nici nu este 
implementat. 


Un trigger se poate crea cu comanda CREATE TRIGGER care are sintaxa 
următoare: 


CREATE TRIGGER <nume> 

{BEFORE | AFTER} {<eveniment>[OR ...]} 
ON <tabela> FOR EACH { ROW | STATEMENT } 
EXECUTE PROCEDURE <functie ( argumente )> 


T 


unde elementele opționale din sintaxă semnifică: 
nume reprezintă numele sub care trigger-ul va fi recunoscut. Numele 


trebuie să fie distinct. 
eveniment poate fi una dintre opțiuni: INSERT, DELETE, UPDATE. 
tabela numele tabelei pentru care se aplică trigger-ul. 


funcția numele funcției care va execuatată. 
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argumente lista de argumente care se furnizează funcției. 


Acţiunea unui trigger declanşează înainte (BEFORE) sau după (AFTER) o 
încercare de modificare unei înregistrări (ROW) sau a întregii tabele (STATEMENT). 
Dacă operaţia se declanşează înainte atunci prin funcția apelată se poate renunţa la 
desfăşurarea evenimentului, dacă trigger-ul este inițiat după eveniment atunci toate 
modificările sunt vizibile. 


Mai multe triggere ataşate aceluiaşi eveniment al unei tabele tratarea lor se 
initializeaza în ordine alfabetică. 


Se poate renunța la utilizarea serviciului unui trigger prin eliminarea acestuia 
din sistem. Un trigger este eliminat prin comanda DROP TRIGGER a cărei sintaxă 
este: 


DROP TRIGGER <nume> ON <tabela> [CASCADE | RESTRICT] 


unde: 
nume reprezintă numele unui trigger deja definit. 
tabela numele tabelei pentru care se aplică trigger-ul. 


Triggerul identificat prin nume care este ataşat tabelei specificate este 
eliminat. Dacă numele său nu se regăseşte în baza de date se generează o eroare. Dacă 
se specifică opțiunea RESTRICT se respinge executarea comenzii dacă triggerul are 
ataşate obiecte dependente. Dacă se specifică opțiunea CASCADE toate obiectele 
dependente se elimină automat. 


5.6. BIBLIOGRAFIE 


[85] *** — Mimer SOL - Reference Manual, Version 8.2; Mimer Information Technology AB, 
Uppsala, Sweden 2000. 

[86] Browne Allen, Balter Alison: Bazele Access 95; Editura Teora, Bucureşti 1998. 

[87] CAE specification, Structured Query Language (SOL), Version 2. X/Open document 
number: C449. ISBN: 1-85912-151-9. 

[88] Din Akeel I.: Structured Query Language (SOL) — A practical introduction; Blackwell, 

[89] ISO/IEC 9075:1992(E) Information technology—Database languages—SQL: International 
Standard for the Database Language SQL; ISO 9075:1992. 

[90] ISO/IEC 9075-1:1999(E) Information technology - Database languages — SOL; Part 1: 
Framework (SQL / Framework); ISO 9075-1:1999. 

[91] ISO/IEC 9075-2:1999(E) Information technology - Database languages — SOL; Part 2: 
Foundation (SOL / Foundation); ISO 9075-2:1999. 


94 


Baze de date şi algoritmi pentru căi de comunicaţie 


[92] ISO/IEC 9075-3:1999(E) Information technology - Database languages — SOL; Part 3: 
Call-Level Interface (SOL / CLI); ISO 9075-3:1999. 

[93] ISO/IEC 9075-4:1996(E) Database Language SOL - Part 4: Persistent Stored Modules 
(SQL/PSM); ISO 9075-4:1996. 

[94] ISO/IEC 9075-4:1999(E) Information technology - Database languages — SOL; Part 4: 
Persistent Stored Modules (SOL / PSM); ISO 9075-4:1999. 

[95] ISO/IEC 9075-5:1999(E) Information technology - Database languages — SOL; Part 5: 
Host Language Bindings (SOL / Bindings); ISO 9075-5:1999. 

[96] Luers Tom: Bazele Oracle7; Editura Teora, Bucuresti 1998. 

[97] Perkins Jeff, Morgan Bryan: SOL fara profesor, in 14 zile; Editura Teora, Bucuresti 
1998. 

[98] Popa Gheorghe, et al.: Sisteme de gestiune a bazelor de date; Editura ALL, Bucuresti 
1994. 


95 


Scînteie Rodian Baze de date şi algoritmi pentru căi de comunicaţie 
ISBN 973-86343-3-4 Editura Societăţii Academice ,,Matei-Teiu Botez” 
laşi 2003 


BAZE DE DATE DIN 
MANAGEMENTUL INFRASTRUCTURII 


Fiecare instituţie implicată în administrarea patrimoniului infrastructurii 
transportului se confruntă permanent cu starea sistemului în funcțiune, cu 
performanțele sale, cu modificările în curs şi cu facilitățile viitoare ce urmează a se 
construi. Facilitatile viitoare depind de nevoile viitoare de transport ale utilizatorilor 
şi de capacitatea şi dorinţa acestor utilizatori de a plăti preţul pentru aceste facilități. 


Gestionarea eficientă a infrastructurii transporturilor presupune existența unei 
infrastructuri informaţionale corespunzătoare la nivelul administratorului. Acesta 
trebuie să posede aparatura necesară pentru a putea colecta, transmite, stoca, regăsi, 
prelucra şi raporta datele legate de inventar dar şi instrumentele logice şi 
metodologice de procesare a acestora şi obţinerea de informaţii utile. 


O administrare promptă şi corectă se poate baza numai pe date corecte şi 
disponibile atunci când sunt cerute. Aceste date trebuie colectate şi păstrate în baze de 
date. Prelucrarea lor trebuie să genereze strategii utile şi utilizabile care să conducă la 
păstrarea sau îmbunătăţirea stării globale a sistemului de transport. Permanenta 
evoluţie a tehnologiei transporturilor, modificările din mediul economic şi social 
impun modificări în necesarul de date utile. 


Modalitatile de colectare, transmitere, stocare, regăsire şi diseminare a datelor 
sunt permanent afectare de evoluţia tehnologiei informaţiei. În consecință, procedurile 
de evaluare a necesarului de date, metodele de colectare, structura bazelor de date, 
programele de prelucrare şi metodologia de diseminare trebuie să fie flexibile, 
adaptabile cu costuri minime la noile condiții. 
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6.1. NECESARUL DE DATE 


TIPURI DE DATE NECESARE 


Deoarece datele de detaliu se pot schimba, tratarea ansamblului trebuie să se 
facă la nivel de categorie. Pentru cunoaşterea completă a sistemului trebui să 
dispunem de patru categorii de date: 


e Oferta; 
e Cerere; 
e Performanţe; 
e Impact. 

Oferta descrie datele care se referă la reţeaua fizică şi la serviciile furnizate in 
manieră comercială precum şi costurile acestora. Cererea include date asupra nevoii 
de mobilitate a bunurilor şi persoanelor, distanțele parcurse, frecvența utilizări şi 
costurile asociate. Datele privind performanţa se constituie într-o măsură a capacității 
ofertei de a acoperi cererea cu costuri care să asigure eficiența economică. Datele de 
impact descriu efectele pe care sistemul de transport le produce asupra mediului 
înconjurător fizic şi social. 


Stocarea datelor trebuie să ţină cont de categoria de transport la care se referă. 
Datele adresează specific căile rutiere, calea ferată, transportul aerian sau naval. 
Unele organisme legislative şi guvernamentale din diferite tari tratează sistemul de 
transport în comun ca un element separat şi se impune evidenţierea individualizată a 
acestuia. 


În cadrul categoriilor de date enumerate mai sus sunt incluse următoarele 
tipuri de date: 


+ Oferta 
e Reţeaua rutieră: 

e Date de sistem: intersecţii şi sectoare; lungime şi număr de benzi; 
capacitatea; împărțirea pe clase funcţionale şi categorii de administrare; 
suprafaţa de teren ocupată; variante ocolitoare; etc. 

e Date privind serviciile: acces din diferite locaţii şi conexiunea dintre 
diferite categorii de drumuri; acces intermodal la punctele de transfer 
(CF, aeroport, port cu distanțe corespunzătoare), furnizori de servicii 
de depanare şi informare; taxe (de trecere, de parcare etc.); 

e Date privind utilitatile: inventarul utilităţilor (staţii de autobuz, zone de 
parcare, terminale de camioane; zone de transfer a containerelor, etc.); 
date de utilizarea terenului de către utilităţi, zone urbane permise 
pentru accesul camioanelor; etc. 

e Date de stare: starea imbracamintilor rutiere, pe categorii de drum (IRI, 
degradare, etc.); date privind starea structurilor rutiere (poduri, 
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tuneluri, rampe de acces, ziduri de sprijin, drenuri etc.); vârsta 
sectoarelor şi structurilor rutiere; etc. 

Proiecte: proiecte propuse şi aprobate a fi executate cu specificarea 
surselor de finanţare; planuri de dezvoltare şi modificare a reţelei, date 
de istoric privind lucrările efectuate şi evoluția proiectelor (întreţinere, 
reparaţii, reabilitare, inspecție etc.); proiecte de întreţinere; proiecte tip 
(de construcție, întreţinere, reparare, reabilitare, înlocuire). 


e Calea ferată: 


Date de sistem: lungimea liniei (cu destinaţie de transport pasageri şi 
mărfuri), noduri şi sectoare; capacitate; împărțirea pe categorii şi tipul 
de tractare permis; teren utilizat; etc. 

Date privind serviciile: localități deservite; frecvenţa şi orarul curselor 
servicii; taxe şi costuri de călătorie; etc. 

Date privind utilităţile: număr de vagoane disponibile; inventarul 
echipamentelor pentru trecerile la nivel cu drumurile; terminale pentru 
transfer intermodal de mărfuri şi călători, depozite disponibile; 
inventarul infrastructurii; etc. 

Date de stare: vârsta liniei, vagoanelor, podurilor, tunelurilor şi a 
echipamentului; înregistrări privind întreţinerea; etc. 

Proiecte: lista proiectelor realizate, lista proiectelor noi propuse pentru 
realizare, extinderi şi modificări, proiecte de întreţinere etc. 


e Transport aerian: 


Date de sistem: aeroporturi şi piste oferite, terenul utilizat pentru 
extinderea aeroporturilor, capacitatea şi utilizarea principalelor linii; 
Date privind serviciile: număr de furnizori şi localizarea lor, locaţii 
deservite, frecvenţa transporturilor, acces la facilități de transfer şi 
transfer intermodal, tarife şi componenţa lor etc.; 

Date privind utilităţile: facilități de transfer a pasagerilor, echipamente 
de transfer marfă, spații de depozitare a mărfurilor etc.; 

Date de stare: starea pistelor de aterizare (vârstă, întreţinere, istoricul 
intervențiilor), starea terminalelor (vârstă, întreţinere, istoricul 
intervențiilor), starea avioanelor (vârstă, întreținere, istoricul 
reparațiilor), starea echipamentelor de transfer etc.; 

Proiecte: lista proiectelor realizate, lista proiectelor noi propuse, date 
de evaluare a proiectelor, extinderi şi modificări, proiecte de întreţinere 
etc. 


e Transport naval: 


Date de sistem: porturi existente, porțiunea de teren ocupată pe uscat, 
docuri şi capacitatea lor, capacitatea principalelor linii, teren disponibil 
pentru extinderea porturilor; 
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e Date privind serviciile: acces spre alte moduri de transport, linii navale 
şi linii de feribot, linii de barje, conexiuni multimodale, perioada din an 
cât portul este practicabil, valoarea şi compoziţia tarifelor; 

e Date privind utilitatile: număr de furnizori, număr de spații de acostare 
pentru nave particulare, spaţii de depozitare a mărfurilor, facilități de 
transfer, locuri de acostare, etc. 

e Date de stare: programul de dragare, docuri şi acostamente (vârstă, 
întreţinere, istoricul intervențiilor), mijloace de dirijare a navigaţiei 
(vârstă, întreţinere, istoricul intervențiilor), nave şi feriboturi (vârstă, 
întreţinere, istoricul intervențiilor), adâncimea şi lățimea canalelor, etc. 

e Proiecte: lista proiectelor realizate, lista proiectelor noi propuse, date 
de evaluarea proiectelor, extinderi şi modificări planificate, proiecte de 
întreţinere etc. 

«e Cererea 

e Date economice: date de venit pe gospodării şi regiuni (istoric, prezent, 
prevăzut), date privind angajarea forței de muncă (istoric, prezent, 
prevăzut), posesia de vehicule, costul pe călătorie, depozite şi distribuitori, 
puncte de import/export, proiecte de dezvoltare economică; 

e Date demografice: date privind populația şi forța de muncă, caracteristicile 
gospodăriilor, etc. 

e Utilizarea terenului: parcelare (destinaţie şi suprafeţe — istoric, prezent, 
perspectivă), date privind gospodăriile (localizarea, distribuţie, densitatea 
ocupării), date privind accesul, zonarea etc.; 

e Date privind circulaţia: date privind necesarul de transport origine-destinatie, 
factori multimodali, factori speciali de generare a transportului (turism, 
excursii profesionale, pelerinaje, evenimente speciale), date privind 
volumul de trafic, factori decizionali privind alegerea modului expediţie şi 
deplasare (timp de parcurs prin diferite moduri, costurile relative); 

e Comportamentul utilizatorilor: date privind opțiunile în transport (auto, naval, 
aerian, cale ferată, costuri de transport, costuri de parcare, costuri de 
închiriere, procent de zone industriale şi comerciale accesibile prin mers pe 
jos), date psihologic privind comportamentul în alegerea, date privind 
preferințele (disponibilitatea de a plăti, nivel de performanţă cerut, 
disponibilitatea de a coopera în realizarea deplasărilor), comportamentul 
transportatorilor (respectarea orarului, preţuri discriminatorii, contracte 
multimodale). 

“e Performanţa 

e Siguranța transporturilor: date privind incidentele (număr, tip, localizare şi 
durată), date privind accidentele (număr, tip, localizare şi durată), date 
privind intervențiile medicale (timp de răspuns, număr de furnizori etc.) 

e Măsura performanţei: date privind performanțele şoselele (congestii, 
deplasări tonăxkilometru, întârzieri, viteza medie de deplasare, localizarea 
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accidentelor şi timpul mediu de degajare — istoric, prezent, perspectivă), 
costul transportului, timp de livrare, procent de degradare a mărfurilor, 
timp de aşteptare la terminale, etc.; 

.% Impactul 

e Calitatea aerului: date privind vehiculele înregistrate (tip, număr, tipul de 
combustibil consumat), date privind viteza pe clase de vehicule, date 
privind numărul de călătorii, emisii de poluanti pe clase de vehicule 
(istoric, prezent, perspectivă); 

e Alte date privind mediul: impact vizual şi estetic, zgomot şi vibrații emise, 
date privind ecosistemele traversate (animale şi plante rare sau ocrotite, 
suprafața zonelor afectate de infrastructura transporturilor ), situri 
arheologice afectate sau blocate, rezervaţii; 

e Utilizarea terenului: impact socio-economic, impact regional; 

e Energia: cantitatea de energie consumată prin fiecare mod de transport, 
eficiența energiei consumate, prețul energiei consumate; 

e Creştere economică: impactul asupra forței de muncă, impactul asupra 
dezvoltării economice regionale, acces la resursele naturale, acces la pieţele 
interne şi externe etc. 


NECESARUL DE DATE LA DIFERITE NIVELURI DE DECIZIE 


Pentru a asigura un management competitiv este necesar a se procesa date 
atât la nivel de rețea cât şi pentru locaţii punctuale pentru proiecte individuale. La 
fiecare se iau anumite tipuri de decizii. Este deci natural ca pentru fiecare nivel de 
decizie să existe nevoi diferite de date. În practică se întâlnesc trei niveluri de 
management: nivelul managementului reţelei, nivelul programelor de reţea, nivelul 
managementului proiectelor. Fiecare utilizează seturi proprii de date şi generează 
propriile seturi de date şi informaţii de ieşire. 


Nivelul managementului rețelei se referă la decizii strategice. La acest nivel 
se utilizează pentru: 


e Proiectia cerinţelor viitoare ale încărcării de trafic pe rețea; 
e Evaluarea stării prezente a rețelei; 


e Predictia stării viitoare la nivelul global al rețelei în diverse variate strategice: 
întreţinere, reabilitare şi reconstrucție; 


e Evaluarea impactului diverselor strategii asupra siguranţei traficului, 
eficienţei economice şi mediului înconjurător; 


e Calculul bugetelor asociate diverselor strategii pentru viitoarele intervale 
financiare; 


e Identificarea strategiilor optimale dezvoltare a reţelei; 
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e Realizarea de analize de alocare a costurilor şi studii de tendință privind 
generarea de venituri bugetare. 


Nivelul programelor de reţea este zona operaţională managementului. Aici se 
acumulează şi se prelucrează date pentru: 


e Determinarea istoricului şi tendințelor secțiuni din rețea; 
e Estimarea efectelor factorilor climatici şi de mediu asupra materialelor; 
e Monitorizarea performanţelor: viabilitate, siguranță, capacitate structurală; 


e Evaluarea stării componentelor rețelei şi stabilirea nevoii de lucrări de 
intervenție (întreţinere, reparaţii, reabilitare, reconstrucție); 


e Predictia performanțelor viitoare ale elementelor componente ale reţelei; 
e Prioritizarea lucrărilor de intervenție pe zone şi categorii de intervenție; 


e Stabilirea standardelor de performanţă şi productivitate pentru echipele şi 
echipamentele de întreținere; 


e Programarea activităţilor de întreținere; 


e Determinarea costurilor unitare ale activităţilor de întreținere, reabilitare şi 
construcţie; 


e Estimarea duratei de serviciu pentru lucrările de întreţinere şi reabilitare. 


Nivelul managementului de proiect utilizează date specifice locației şi 
proiectului în cauză pentru: 


e Determinarea caracteristicilor geometrice şi de material ale diferitelor 
componente; 


e Determinarea elementelor de proiectare pentru diferite componente; 
e Determinarea duratei de viata rămase; 
e Selecţia întreţinerii şi metodelor de consolidare; 


e Analiza alternativelor de proiect şi selecţia celei mai convenabile. 


6.2. LOCUL BAZELOR DE DATE ÎN AGENȚIA DE ADMINISTRARE 


Simplul fapt al existenței unei baze de date nu ne rezolvă automat 
problemele. Este necesară dezvoltarea unui întreg sistem pentru a evidenția valoarea 
bazei de date. Este necesar să dezvoltăm sistemul informatic integrat ca parte a 
sistemului informaţional. Aceasta înseamnă stabilirea de canale de comunicaţie, paşi 
de urmat şi calendare pentru furnizarea de date pentru baza de date. 
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De notat faptul că baza de date este foarte importantă dar este doar o parte a 
băncii de date. Banca de date fiind acea parte a sistemului informatic în care se 
primesc, se stochează, se extrag şi se procesează datele generând informaţii 
semnificative (a se revedea capitolul 3). În acest context este util să avem nu doar o 
bază de date foarte bună ci un sistem complet capabil să primească, să păstreze, să 
furnizeze, să prelucreze şi să utilizeze într-o manieră corectă informaţiile rezultate. 


O atenție deosebită trebuie acordată persoanei sau organizației care 
administrează baza de date în totalitate sau în parte. Este recomandat ca acel 
compartiment care este cel mai afectat de date să administreze şi să supervizeze baza 


de date şi să-i asigure eficienţa. 


Un exemplu de colectare a datelor este prezentat în figura următoare. 


LABORATOR SECŢIA DE 
REGIONAL DE CERCETARE 
TESTE ŞI ANALIZE 
(compoziția (date de evaluare în 
straturilor) exploatare) 


Sa sor 


ASIGURAREA 
CALITĂŢII 


(date de construcție 
şi materiale) 


BIROU 
GEOTEHNICĂ 


(date de proiectare şi 
criterii de selecție) 


mie 


Fig. 34 Colectarea datelor si banca de date pentru o agentie de drumuri [102] 
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MA 


Studiu iniţial de realizare | 


Vv 


Proiectare | 


y 


Implementare 
şi încărcare 


Y 
Testare 
şi evaluare- = = = = 


Exploatare | 


Vv 


intretinere 
şi îmbunătăţire 


Fig. 35 Ciclul de viaţă al bazelor de date 


Un sistem de baze de date, ca orice produs ingineresc, trebuie gândit ca având 
un ciclu de viata [105], descris în Fig. 35. 


Acţiunile ce trebuie întreprinse în fiecare din fazele unei baze de date pentru 
infrastructura transporturilor sunt următoarele: 


Studiul iniţial de realizare a bazei de date: analiza inventarului agenției; definirea 
problemelor şi restricțiilor; definirea obiectivelor; delimitarea întinderii. 

Proiectarea bazei de date: crearea proiectului conceptual; selectarea sistemului soft 
de gestionare; crearea proiectului logic; crearea proiectului fizic. 

Implementarea şi încărcarea: instalarea SGBD şi crearea bazei de date; încărcarea 
Şi conversia datelor. 2 52 

Testarea şi evaluarea: testarea bazei de date; calibrarea bazei de das Salari 
bazei de date şi a aplicațiilor. 

Exploatarea bazei de date: producerea fluxului de informații cerut. 

Întreținerea şi îmbunătăţirea: identificarea defectelor; observarea erorilor ascunse; 
modificare şi îmbunătăţire. 


PAŞII DE BAZĂ ÎN DEZVOLTAREA UNEI BAZE DE DATE PENTRU 
INTRETINEREA INFRASTRUCTURII TRANSPORTURILOR 


Paşii de bază ce trebuie parcurşi în dezvoltarea unui sistem de baze de date 
pentru întreţinere a infrastructurii rutiere sunt descrişi în Fig. 36. Acest sistem este 
unul de bază verificat în timp. Urmărirea paşilor trebuie să se facă însă cu prudenţă şi 
după o analiză atentă a situației specifice a cazului concret. 
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SELECȚIA SAU DEZVOLTAREA 
NIVELUL DE REFERINŢĂ 


| 


DEZVOLTAREA SISTEMULUI DE 
CODIFICARE ŞI FORMATUL 
FORMULARELOR DE 
COLECTAREA A DATELOR 


i 


SELECTAREA SISTEMULUI DE 
CALCUL (sau a altui system de stocare 
şi analiză a datelor) ŞI 


Stocarea, actualizarea, editarea, regăsirea 


DEZVOLTAREA PROGRAMELOR [p 


datelor 
5, 


PROPUNERE DE IPLEMENTARE A 
SISTEMULUI DE BAZE DE DATE 

Ce baze de date? 

Ce vor face? 

Cum vor fi folosite? 

Cine le va folosi? 

Estimarea costurilor anuale de 

întreţinere 

Etc. 


APROBAREA 


MANAGEMENTULUI 


y 


PLANIFICAREA SI PROIECTAREA 
SISTEMULUI 

Revizuirea altor sisteme în funcțiune 

Definirea obiectivelor specifice 

Definirea restricţiilor 

Planificarea activităţilor 

Programarea 

Estimarea costurilor 

Etc. 


a 
ra INTRĂRILE SISTEMULUI N 


Definirea intrărilor 

Clasificarea intrărilor 

Definirea tehnicilor de măsură 
Definirea responsabilitatilor de 
implementare (cine face ce si cui 


m) pe- 
Dialog cu şi feedback de la toți | 
furnizorii de date 


DEZVOLTAREA PLANULUI DE 
ESANTIONARE 
e  Fixarea criterii de selecţie 
e Definire proceduri de implementare 


| 


RAPORTAREA 
e Trasarea sistemului, intrărilor şi 
ieşirilor 
e Manuale şi giduri preliminare 


IMPLEMENTARE TEST 
e Plan de eşantionare şi procesarea pop 


datelor 


l 


REVIZUIREA SISTEMULUI 
Pentru posibile îmbunătățiri rezultate în 
urma testelor 


DEZVOLTAREA MANUALELOR SI 
GHIDURILOR DE UTILIZARE 


! 


DEZVOLTAREA DE PACHETE DE 
ANALIZA A DATELOR 
e Proiectare, e Management, 

e Exploatare, Întreţinere, 

( REVIZUIREA PERIODICĂ A 

SITEMULUI 

e Examinarea modului cum sunt 

indeplinite funcţiile proiectate 


Modificarea intrărilor, proceselor şi 
ieşirilor sistemului 


Fig. 36 Paşii în dezvoltarea unui sistem de baze de date pentru drumuri [102] 


104 


Baze de date şi algoritmi pentru căi de comunicaţie 


6.3. IMPLEMENTAREA BAZELOR DE DATE ÎN TRANSPORTURI 


AND - BANCA CENTRALĂ DE DATE TEHNICE RUTIERE 


Un exemplu în tara noastră este baza de date privind infrastructura 
transporturilor a fost dezvoltată în cadrul Administraţiei Naţionale a Drumurilor. 
Denumită Banca Centrală de Date Tehnice Rutiere — BCDTR, conţine date utilizate în 
administrarea reţelei de drumuri naționale din România. 


Administraţia Naţională a Drumurilor a trecut încă dinainte de 1990 la 
crearea unei baze de date care să cuprindă date despre întregul inventar rutier. Banca 
Centrală de Date Tehnice Rutiere — BCDTR a fost concepută ca o structură dinamică. 


Concepută printr-un efort național, BCDTR a fost inițial implementată la 
INCERTRANS, la vremea respectivă singurul institut de profil din tara. Ea a fost 
preluată şi continuată odată cu înfiinţarea Centrului de Studii Tehnice şi Informatică — 
CESTRIN (ca organism tehnic al AND) care administrează şi date stocate. 


Elaborată iniţial în anii optzeci pe mini-calculatoare din seria CORAL, banca 
de date a fost translatată pe micro-calculatoare compatibile IBM-PC care rulează sub 
Windows. Sistemul de gestiune al bazelor de date ales este ORACLE. Concepută de 
la început ca un sistem mare, ea a fost creată utilizând sistemul de gestiune ORACLE 
2.0, o implementare pentru mini-calculatoare şi a preluat abilităţile şi limitările 
programului. Pe măsură ce trecerea timpului aducea noi versiuni ale softului de bază, 
ea a fost trecută pe aceste versiuni şi actualmente este rulată pe reţele de 
microcalculatoare sub ORACLE8. BCDTR permite adăugarea de tabele noi şi 
completarea celor existente cu noi coloane. 


Datele şi informaţiile au fost astfel structurate încât să descrie cât mai bine 
rețeaua. Analizând capacitatea de colectare a administraţiei şi colaboratorilor s-a 
stabilit un nucleu de date de bază urmând ca pe măsură ce se înaintează în gradul de 
cunoaştere numărul şi tipul de date să se extindă. 


Prezentăm mai jos schematic o parte dintre tabelele conținute de BCDTR aşa 
cum au fost concepute de specialiştii CESTRIN care au lucrat la dezvoltarea sa. 


Date generale şi organizatorice 


CODUNIT Codificarea unităților şi subunitatilor administrativ teritoriale 
DRDP Unităţi administrative din cadrul A.N.D. 

LOCALIT Localităţi traversate — date generale 

ANEXEAND Construcţii anexe aparţinând A.N.D. 

DEPMAT Depozite materiale 


DEPSCULE Depozite scule 

DUTILAJE Depozit utilaje 

DJDP Direcţii judeţene de drumuri şi poduri 
POSTCINT Posturi fixe de cântărire 
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Date generale privind reţeaua de drumuri 
DRUMURI Drumuri publice 
DRUMURIE Drumuri europene 
DRUMNAT Lungime drumuri naționale 


DNJUD Reţea drumuri naționale pe judeţe 

LREALA Lungimea reală a drumurilor 

SUPRAP Suprapunere sectoare de drum 

Date privind sectoarele rutiere 

RETDRDP Reţeaua de drumuri nationale aparținând direcțiilor 
RETSECT Reţeaua de drumuri naționale aparţinând fiecărei SDN 
RETDISTR Reţeaua de drumuri naționale aparţinând fiecărui district 
RETJUD Reţeaua judeţeană de drumuri 

Date privind 

NRBENZI Număr benzi de circulație pe drumuri 


NRBENZIA Număr benzi de circulație pe autostrăzi 
BENZIINC Benzi de încadrare 

BENZIS Benzi suplimentare la drumuri şi autostrăzi 
INTERSECTII  Intersecţii cu alte drumuri 

INTERSCF Intersectii cu calea ferată 


Date privind geometria 


CURBE Curbe în plan de situaţie 
DECLIV Declivitati drumuri 
PROFTRS Tip profil transversal 


RACVERT Curbe de racordare verticală 


Date privind structura drumurilor 


PLATFORM Platforma drumului 
SISTEMR Alcătuirea sistemului rutier inițial şi a straturilor de ranforsare 


Date de siguranţa circulaţiei 


INDRUT Indicatoare rutiere 
MARCAJE Marcaje rutiere 
SPERIC Sectoare periculoase cu concentrare de accidente 


Date privind elemente adiacente drumurilor 
ACOSTAMENTE Date privind caracteristicile acostamentelor 


PCICL Piste pentru ciclişti 

SANTURI Santuri laterale 

TALUZURI Taluzuri împădurite sau protejate 
PARAPETE Stâlpi de dirijare şi parapete 
PLANTRUT Plantatii rutiere existente 
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Date despre poduri 


COD POD 
PODURI 
PODINAM 
PODINFR 
PODREP 
PODSTARE 
PODSTAT 
PODSUPR 
PODETE 


Codificare elemente poduri 

Date generale poduri 

Rezultatele incercarilor dinamice la poduri 
Caracteristici ale infrastructurii 

Lucrari de reparatii efectuate la poduri 

Stare tehnica poduri 

Rezultatele incercarii statice efectuate la poduri 
Elemente geometrice şi constructive suprastructură 
Podete 


Date despre alte lucrari de arta 


TUNELURI 
ZSPRIJIN 
DRENURI 


Tuneluri rutiere 
Ziduri de sprijin 
Drenuri 


Date de relief si mediu 


PAMINT 
RELIEF 
TIPCLIM 
TORENTI 
STABILIT 
S_INUD 


Date de stare 
ST_TRONSON 
TRONSOANE 
VIABDR 


Natura pământului de fundaţie 
Condiţii de relief 

Tipul climatic 

Amenajare torenti 

Stabilitate teren 

Sectoare inundabile 


Stare tehnică tronsoane omogene 
Tronsoane omogene 
Starea de viabilitate a drumurilor 


Date de lucrări de întreţinere 


ACTIARNA 


Viabilitatea drumului pe timpul iernii 


TRATAMENTE Tratamente bituminoase 


RANFORS 


Ranforsări necesare 


Date de autorizare 


LUCRARI 


Autorizaţii de lucrări 


După cum se observă, în prezent, tabelele implementate nu acoperă în 
totalitate tipurile de date identificate mai înainte şi nici necesarul de date la fiecare 


nivel managerial. 


Totuşi, aceste date acoperă în bună măsură necesarul de date utilizate în mod 
curent de Administrația Naţionale a Drumurilor şi constituie un punct de plecare în 
eventuale dezvoltări ulterioare, mai performante. 
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ALGORITMI ÎN 
MANAGEMENTUL INFRASTRUCTURII 


7.1. NOȚIUNI FUNDAMENTALE 


Noţiunea de algoritm este fundamentală în domeniul programării, cercetării 
operaționale, a analizei de sistem precum şi a modelării şi simulării, a ingineriei în 
general. Algoritmul este o metodologie sau o procedură ce cuprinde o secvenţă de 
instrucțiuni inlantuite logic ce trebuie să rezolve o problemă dată. Algoritmul 
primeşte un set de date de intrare, le prelucrează şi le transformă un set de date de 
ieşire bine definite (Fig. 37). Gândirea umană a lucrat în permanență pe baze 
algoritmice chiar dacă nu le-a teoretizat din totdeauna. 


algoritm 


Fig. 37 Algoritm 
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Matematic, un algoritm este o reprezentare a funcţiei e = f (i ; p) „unde į € J 


este setul de date de intrare, iar e € E este setul de date de ieşire. Variabila întreagă 
p se referă la faptul că algoritmul se încheie în p paşi. Valoarea reală a lui p este 


în general legată de dimensiunea setului de date de intrare. Un algoritm trebuie 
construit în jurul a patru concepte fundamentale: să fie corect, să fie finit, să fie 
definit şi să fie eficient. 


Corectitudinea: algoritmul trebuie să rezolve corect funcția pentru care a 
fost proiectat. 


Finititudine: secvența de instrucțiuni trebuie să genereze un rezultat după un 
număr finit de paşi pentru seturile de date care respectă restricțiile impuse. 


Definire: paşii trebuie precis definiti şi să efectueze operații precise. 


Eficienta: secvența de instrucțiuni (paşii) algoritmului trebuie să poată fi 
executați pe o maşină „fizic realizabilă”. 


Algoritmul este o ,,reteta” care să ne conducă de la punctul de pornire la 
rezultat. Altfel spus un algoritm este o procedură bine definită de calcul matematic, 
logic şi simbolic care transformă datele de intrare în date de ieşire sau informaţii. În 
utilizarea lor algoritmii trebuie să răspundă la câteva întrebări practice: 


e Finalitatea: după parcurgerea unui număr de paşi se opreşte şi generează un 
rezultat. Care sunt restricţiile care se impun şi în ce condiții nu are 
finalitate? 

e Precizia: corectitudinea rezultatului este evaluată cu o anumită toleranță. 
Acolo unde nu există metode de calcul exacte trebuie stabilite aprioric 
abaterile tolerate. Ce precizie trebuie adoptată şi care sunt cele mai 
eficiente metode pe care proiectantul algoritmului trebuie să le aibă în 
vedere pentru limitarea efectelor propagării erorilor de calcul? 

e Viteza: datele de intrare sunt reprezentate de seturi variabile. Durata de 
parcurgere a tuturor paşilor depinde de dimensiunea seturilor de date de 
intrare. Structura şi dimensiunea seturilor de date, succesiunea paşilor de 
calcul şi precizia sunt împreună valori critice. Parcurgerea algoritmului 
trebuie să se realizeze într-un interval de timp suficient de scurt pentru ca 
rezultatul generat să mai fie util. 

e Spaţiul: datele de intrare, structurile ce păstrează valorile intermediare, 
variabilele de stare, datele de ieşire se regăsesc fizic prin memoria ocupată 
în calculator. Reprezentarea numerelor reale, de exemplu, poate fi făcută în 
diferite moduri, fiecare modalitate ocupând un spaţiu diferit care uneori 
depinde şi de construcţia fizică a calculatorului. Memoria disponibilă este 
limitată. În consecință implementarea algoritmului poate depinde de 
maşina fizică disponibilă. 


Paşii care apar pe durata execuţiei unui algoritm pot fi grupaţi în: 
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e Pasi de atribuire (valorile iniţiale sunt ataşate unor variabile); 

e Pasi aritmetici (care contin operații simple de adunare, scădere, înmulțire, 
împărțire sau funcţii complexe ori operaţii simbolice); 

e Pasi logici (cum ar fi comparare a două numere etc.). 


Din punct de vedere istoric, algoritmii sunt, ca denumire şi ca utilizare, o 
invenţie recentă chiar dacă actualmente pare o noţiune firească, fără de care nu putem 
concepe activitatea curentă. Un element cheie în dezvoltarea gândirii algoritmice a 
fost sistemul pozitional de notare a numerelor. Sistemul de notare numerică roman era 
deosebit de greoi şi nu permitea dezvoltarea unei gândiri logice, algoritmice. Primul 
sistem de notare numerică pozitionala despre care se păstrează mărturii se pare că a 
fost utilizat de mayaşi acum 2000 de ani, pe baza unui sistem de numerație în baza 
20, dar nu există dovezi că s-au dezvoltat şi algoritmi matematici. Chiar dacă au 
existat lucrări pe această temă ele au fost distruse, împreună cu întreaga literatură 
ştiinţifică, odată cu cucerirea spaniolă creştină. Fenomene asemănătoare se cunosc şi 
în Extremul Orient, de exemplu China. De altfel este foarte posibil ca şi în Europa şi 
Orientul Mijlociu să se fi produs astfel de distrugeri sistematice atunci când noi 
curente politice şi/sau religioase s-au impus. Eliminarea cărților este, în istorie, la fel 
de răspândită ca şi eliminarea oamenilor. 


Sistemul pozitional de notare a apărut în India în jurul anului 600 d.C. si 
începe să se răspândească pe la 750 d.C. când după cucerirea musulmană mai multe 
lucrări indiene ce cuprind descrierea unor algoritmi aritmetici sunt preluate în Persia 
şi traduse în arabă. 


Prima persoană cunoscută că a tratat acest subiect este al-Khwarizmi şi se 
pare că de aici provine şi denumirea de „algoritm”. Pe la 1200 lucrarea a fost tradusă 
în latină şi s-a făcut cunoscută în Europa. 


Sistemul zecimal a fost inventat în secolul 10 de matematicianul sirian 
al-Uglidisi din Damasc. Munca sa a fost reluată şi dezvoltată cinci secole mai târziu 
de matematicianul persan al-Kashi. 


De atunci, proiectare, implementare şi utilizarea algoritmilor a devenit o parte 
implicită a cercetării ştiinţifice. Chestiunea a fost reluată la nivelul teoretic mai ales 
după apariţia calculatoarelor când realizarea de programe informatice se bazează larg 
pe dezvoltarea de algoritmi, iar rezolvarea de probleme complexe implică un consum 
ridicat de memorie şi de timp, reducerea consumului de resurse fiind un element cheie 
în acceptarea uneia sau alteia dintre soluții. 


Utilizarea algoritmilor este uzuală în cele mai diverse ramuri ştiinţifice şi 
tehnice. Studiile pentru rezolvarea de probleme de interes deosebit au generat o serie 
de algoritmi celebri: 


e Construcțiile lui Euclid, 
e Calculul lui Newton pentru găsirea rădăcinii, 
e Transformata Fourier rapidă, 
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Algoritmi de compresie (Huffman, Lempel-Ziv, GIF, MPEG), 
Algoritmi de criptare, 

Algoritmul simplex pentru programare liniară, 

Algoritmi de găsire a căii minime (Dijkstra, Bellman-Ford etc.), 
Controlul congestiei şi redirectarea traficului, 

Recunoaşterea formelor (genetică, evaluarea stării de degradare a 
betonului), 

e Algoritmul de triangulatie (proiectare asistată de calculator, simulare). 


7.2. DESCRIEREA ALGORITMILOR 


Pentru a se proiecta eficient algoritmii în aşa fel încât să nu existe probleme 
de înţelegere pentru cei care fac efectiv programarea s-au inventat metode de 
reprezentare. Cele mai cunoscute sunt descrierea prin diagrame logice şi limbajul 
pseudocod. Acestea sunt instrumente utile şi foarte uşor de manevrat. 


DIAGRAMELE LOGICE 


Diagramele logice constau în reprezentarea grafică prin blocuri a operaţiilor 
care trebuie efectuate. Blocurile împreună cu conectorii şi cu săgețile de legătură, care 
stabilesc fluxul datelor, determină modalitățile de prelucrare a datelor de la intrare 
până la ieşire. 


Tabelul 6. Elemente utilizate în schemele logice 


Ci”) Bloc de intrare/iesire 


Bloc de proces 


Bloc decizional 


Bloc al proceselor predefinite 


Ce Bloc de pregătirea 
O B Conectori 
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LIMBAJUL PSEUDOCOD 


Pseudocod este un crochiu al unui algoritm, scris într-o formă care poate cu 
uşurinţă să fie transformat in program. 


Pseudocod-ul nu poate fi compilat sau executat şi nu are reguli reale de 
sintaxă sau de formulare. Este doar o înşiruire de paşi logici de urmat în rezolvarea 
problemei. Permite analistului şi programatorului să se concentreze asupra problemei 
şi fără să insiste asupra considerentelor legate de limbajul de programare. 


Descrierea algoritmului cu ajutorul pseudocod se poate face fără a cunoaşte 
de la început în ce limbaj de pragramare va fi scris codul, ba chiar se poate face fără a 
cunoaşte obligatoriu un limbaj de programare. De asemenea, nu există restricții 
asupra limbii utilizate, dar cei mai mulți analişti preferă direct limba engleză. Sunt 
acceptate semne grafice sugestive împrumutate sau nu din formulele matematice. 
Astfel pentru atribuire se utilizează frecvent semnul — (săgeată spre stânga). 


7.3. EFICIENȚA ALGORITMILOR 


Eficienţa unui program rezultat din implementarea unui algoritm depinde de 
tehnicile utilizate. Putem distinge aici două noţiuni: (1) algoritm „conceptual” şi 
(2) algoritm „complet”. 


Algoritmul conceptual se limitează la a privi lucrurile la modul general fără a 
intra în detalii. Cel de al doilea, pornind de la primul, intră în amănunte şi tratează 
inclusiv reprezentarea şi accesul la date, impunând alegerea unor anumite structuri 
specifice şi a tehnicilor particulare de tratare a problemei. 


COMPLEXITATEA ALGORITMILOR 


Aşa cum s-a precizat mai sus un algoritm este o procedură de rezolvare 
secventiala a problemelor care apar în inginerie şi nu numai. Timpul de calcul 
consumat diferă de la un caz particular la altul. Pentru anumite situaţii favorabile 
timpul de calcul poate fi extrem de scurt. Pentru alte situații nefavorabile trebuie să 
aşteptăm foarte mult pentru ca algoritmul să se încheie. Deoarece, pentru rezolvarea 
unei anumite probleme, pot fi conceputi mai multi algoritmi de calcul este bine să 
găsim o măsură a performanţei fiecăruia. 


Utilizând o astfel de măsură şi comparând costurilor şi beneficiilor generate 
putem alege cel mai bun dintre algoritmii disponibili pentru rezolvarea problemei. 


Cea mai des folosită măsură este timpul de calcul. Uneori se poate utiliza 
drept indicator şi cantitatea de memorie utilizată. Aceasta din urmă este tot mai rar 
folosită, mai ales ca termen ajutător, deoarece calculatoarele dispombile oferă 
memorie suficientă pentru rezolvarea problemelor practice. Totuşi, acesta este un 
factor de care trebuie ținut seama în probleme de conducere “on-line” a proceselor, 
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acolo unde costul permis pentru echipamentul achiziţionat este restricţionat de 
beneficiile predictibile. 


De remarcat că simpla comparare a timpului de calcul prin implementarea şi 
rularea algoritmilor, deşi furnizează unele indicaţii, nu este neapărat eficientă. Timpul 
efectiv de rulare este diferit pe diferite calculatoare. De asemenea este dependent de 
setul particular de date, de limbajul de programare şi de compilatorul specific folosit. 


Este necesară o altfel de metodă care să ne ofere o măsură mai precisă şi să 
nu fie influențată de situaţii particulare (calculator, compilator, valori etc.). Cea mai 
sigură metodă este calcularea numărului total de paşi pe care un algoritm îi parcurge 
pe durata rezolvării problemei şi care determină timpul total de calcul. Acesta depinde 
de dimensiunea setului de date de intrare. Funcția care stabileşte o relație între 
dimensiunea setului de date de intrare şi numărul de paşi se numeşte complexitatea 
algoritmului. Din nefericire nu se poate totdeauna stabili şi demonstra o relaţie exactă 
între cele două mărimi. 


STRUCTURI CICLICE 


În cazul pasilor aritmetici şi de atribuire problemele sunt clare: fiecare pas 
contează o singură dată. Probleme apar în cazul paşilor logici. Aceştia pot conduce la 
executarea de secvenţe de instrucţiuni de lungimi diferite funcție de valoarea rezultată 
în operația logică. De asemenea prin ataşarea unei instrucțiuni de salt înapoi pot 
rezulta structuri ciclice în desfăşurarea algoritmului. 


Structuri ciclice tipice sunt while , repeat...until. 


Pasul i 
DA Pasul i+1 
NU 
Pasul i 
Pasul 1 


Fig. 38 Structuri ciclice tipice: while (a) şi repeat...until (b) 
Se poate observa că paşii cuprinşi într-o buclă de tip repeat...until se execută 
cel puţin o dată şi acest lucru trebuie considerat când se studiază algoritmul. 


Un exemplu tipic de algoritm care utilizează o structură ciclică de program 
este calculare factorialului unui număr (Fig. 39). 
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Funct Factorial( n: Integer ) : Integer 


If n=0 Then Return 1 

Rez e 1 

di se 

Repeat // început buclă 
Rez e Rez * i 
ee E 

Until i=n // sfâşit buclă 

Return Rez 


EndFunct 
Fig. 39 Calculul functiei factorial prin utilizarea structurilor ciclice 


Un alt exemplu tipic este calculul sirului Fibonacci. Acest sir este caracterizat 
prin următoarele: primul număr este F) =0, următorul este F, =1 iar celelalte 


numere reprezintă suma precedentelor două din şir. 


Funct Fibonacci ( n: Integer ) : Integer 


If n<O then Error 
If n=0 Then Return 0 
If n=1 Then Return 1 


FO «- 0 
Fl - 1 


I 2 
Repeat // început buclă 
Temp « FO + Fl 
Fo e Fl 
Fl « Temp 
ee A he al. 
Until i = n // sfâşit buclă 


Return Fl 


EndFunct 


Fig. 40 Rezolvarea şirului Fibonacci prin structură ciclică 


RECURSIVITATEA 


Recursivitatea este o metodă de rezolvare problemelor prin descrierea unei 
funcţii prin apelarea aceleiaşi funcţii cu valori inferioare. 
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Exemple pot fi cele date la structuri ciclice. În continuare prezentăm 
rezolvarea algoritmului pentru calculul factorialului unui număr prin apel recursiv. 


Funct Factorial( n: ) 


If n=0 Then Return 1 
Return n * Factorial (N-1) 


EndFunct 


Fig. 41 Rezolvarea functiei factorial prin apel recursiv 


Similar şirul lui Fibonnaci poate fi rezolvat prin apel recursiv. Algoritmul 
este prezentat în figura următoare. 


Funct Fibonacci (n: ) 


If n<O then Error 
If n=0 Then Return 0 
If n=1 Then Return 1 


Return Fibonacci(n-1) + Fibonacci (n-2) 
EndFunct 


Fig. 42 Rezolvarea sirului Fibonacci prin apel recursiv 


O remarcă imediată este faptul ca recursivitatea simplifică mult munca 
programatorilor. Programele scrise sunt mult mai scurte. Complexitatea algoritmului, 
în sensul resurselor consumate, nu respectă totdeauna aceeaşi regulă. 


Un exemplu tipic pentru algoritmii rezolvati prin recursivitate este problema 
turnurilor din Hanoi. 


Hanoi este capitala Vietnamului, un oraş cu o istorie milenară. Într-una din 
mănăstirile sale un grup de călugări sunt păstrătorii unui misterios exerciţiu care a 
preocupat atât pe curioşi cât şi pe oamenii de ştiinţă. Ei dețin trei turnuri (tije 
verticale) şi 64 de discuri din aur de diferite dimensiuni. Discurile sunt aranjate pe 
primul turn de jos în sus în ordine descrescătoare. Mutând câte un disc odată, ele 
trebuie să ajungă în aceeaşi ordine pe cel de-al treilea turn. Se poate utiliza al doilea 
turn ca ajutor dar un disc mai mare nu trebuie aşezat niciodată peste unul mai mic. 


Călugării trebuie să mute continuu discurile pentru a rezolva problema. Se 
spune că atunci când toate cele 64 de discuri vor ajunge la locul lor va veni sfârşitul 
lumii. 
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a 


Fig. 43 Turnurile din Hanoi 


64 discuri 


Problema a fost studiată şi formalizată de matematicianul francez Lucas în 
1883. 


Pornind de la rezultatele sale s-a putut trasa algoritmul care în formatul 
recursiv are formă prezentată în următoarea figură: 


Proc Hanoi (n: integer; A,B,C ) 


If (n=1) 
Then 

Mută un discul de pe A pe B 
Else 


EndProc 
Fig. 44 Rezolvarea recursiva a problemei turnurilor din Hanoi 


Numărul de mutări necesare pentru rezolvarea acestei probleme este dat de 
următorul raționament: 

Nu [Hanoi(n, A,B, C)] = 

Ny [Hanoi(n = 1A); B)| + Nu [Hanoi(l, A,B, c)| + Ny [Hanoi(n -=1,C, B, A)| 


Considerând z durat unei mutări, timpul de rezolvare este dat de: 
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T(n)=2T(n-1)+r 
=2°T(n-2)+2r+r 
= 25T(n—2)+ 227 +27 +r 


o... .......................c.s.. (5) 
= 2" 17(1)+4 2% 27 +.::+227+27+7 
= (pm HO? hr ED? +2+1} 
=(2" -1} 
Dacă n = 64 atunci numărul de paşi de urmat este 
N = 2% —1 = 18.446.744.073.709.551.615 (6) 


Presupunând că o mutare durează o secundă, procesul va dăinui în total 
584.942.417.355 ani. Se pare că lumea nu este în pericol. 


7.4. ANALIZA COMPLEXITĂȚII ALGORITMILOR 


O trecere în revistă a literaturii de specialitate relevă existenţa utilizării pe 
scară largă a trei modalități de măsurare a performanțelor unui algoritm: analiza 
empirică, analiza cazului mediu şi analiza cazului cel mai defavorabil. Fiecare dintre 
măsuri are meritele dar şi dezavantajele sale. 


METODE DE ANALIZĂ 


Analizei empirică are ca obiectiv estimarea comportamentului algoritmului 
în situații practice. Pe baza algoritmului se scrie un program şi se testează modul de 
lucru pe clase de situaţii particulare ale problemei. Abordarea aceasta este utilă în 
validarea analizei matematice care a condus la realizarea algoritmului. Se pot 
compara performanțele a doi algoritmi realizați pentru a rezolva aceeaşi problemă 
prin rularea pe aceeaşi maşină, în aceleaşi condiţii de lucru şi cu acelaşi set de date de 
intrare. De menţionat aici că selecția datelor de intrare este extrem de importantă. 
Pentru seturi particulare diferite se pot obţine timpi de rulare diferiți chiar cu acelaşi 
algoritm în două rulări succesive. Depăşirea impasului se face prin generarea de seturi 
aleatoare de date care se utilizează pentru ambele programe făcând comparatia la 
nivel global. 


Totuşi analiza empirică se poate efectua numai după ce s-a realizat complet 
şi corect scrierea programului. Invalidarea testului duce la irosirea manoperei pentru 
programare fără ca aceasta să aibă o finalitate. 


Dezavantajele majore ale analizei empirice sunt: 
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e performanțele algoritmilor depind de cele mai multe ori de limbajul de 
programare, compilatorul şi computerul utilizate pentru experiment precum 
şi de capacitatea programatorului; 

e analiza însăşi este uneori prea costisitoare şi foarte mare consumatoare de 
timp; 

e compararea poate să nu fie concludentă deoarece anumiţi algoritmi se 
comportă mai bine pentru o clasă de cazuri particulară şi teste diferite 
efectuate cu scopuri diferite pot conduce la rezultate opuse. 


Analiza cazului mediu se bazează pe o analiză probabilistică a apariţiei unor 
clase de realizări (instanţe) ale problemei şi constă în calcularea unui estimator al 
numărului mediu de paşi ai algoritmului. Pe baza acestuia se deduce timpul mediu de 
rulare al algoritmului. 


Ca dezavantaje majore putem enumera: 


e analiza depinde crucial de funcţia de distribuţie a probabilității alese să 
descrie apariţia realizărilor problemei, modificări ale funcţiei pot conduce 
la modificări ale evaluării algoritmului; 

e aprecierea distribuției probabilității este dificil de realizat pentru probleme 
practice, analistul trebuie să parcurgă un număr mare de situaţii unele 
imposibil de conceput aprioric; 

e analiza este cel mai adesea deosebit de complicată şi necesită cunoştinţe 
matematice deosebite chiar pentru analiza unor tipuri simple de algoritmi. 
Acest tip de analiză se bazează pe situaţia medie, „cazul tipic” al intrărilor, 
dar nu furnizează informații despre distribuția ieşirilor. Unele dintre 
cazurile atipice pot conduce la durate excepţional de mari de calcul chiar 
dacă pentru cazul mediu algoritmul se comportă multumitor. 


Analiza cazului cel mai defavorabil furnizează limita superioară a 
numărului de paşi pe care îi parcurge algoritmul oricare ar fi realizarea problemei. În 
această analiză contorizăm numărul maxim posibil de paşi prin care ni se garantează 
că se ajunge la rezultat în oricare situaţie realizabilă în practică. 


Această analiză evită problemele care apar în celelalte tipuri de analiză. Este 
independentă de sistemul şi mediul de calcul şi este relativ uşor de realizat furnizând 
o garantie a plafonului maximal. 


Dezavantajul major este că evaluarea performanţelor unor algoritmi depinde 
de existența unor situaţii „patologice” a căror probabilitate de apariţie este neglijabilă, 
practic nulă. 


NOTAȚIA ASIMPTOTICĂ 


Pentru măsurarea complexităţii prin timpul de rulare s-au dezvoltat diferite 
instrumente, fiecare fiind caracterizat prin notații specifice. Deoarece contabilizarea 
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detaliată a numărului de paşi ai algoritmului este complicată, dificilă şi neproductivă, 
principalul instrument de lucru este notația asimptotică. 


Trebuie notate câteva elemente: 


e suntem preocupaţi de setul numerelor naturale { 0, 1, 2, ... }; 
e n este dimensiunea setului de date de intrare; 
e T(n) este timpul de rulare pentru cazul cel mai defavorabil; 


Notatia asimptotică se bazează pe metoda inducției matematice. Inductia este 
utilizată pentru demonstrarea unei anumită formule generale care este cunoscută sau 
uşor de dedus. Sunt urmate trei etape: 


(1) dovedirea condiției inițiale; 
(2) presupunerea că formula este valabilă pentru n şi 
(3) dovedirea valorii de adevăr pentru n+1. 


Formularea standard este: 


Dacă propoziția P(n) (in cazul nostru afirmatia ca timpul cel mai defavorabil 
este T (n) ) este adevărată pentru n=n, şi dacă pentru orice n= ng P(n) 


implica P(n + 1) atunci propozitia P(n) este adevarata pentru oricare n. 
Prezentăm in continuare câteva modalităţi de descriere a complexităţii 
algoritmilor prin notații asimptotice. 
Notatia © (theta mare) 


Notând g(n) numărul total de paşi, unde n este dimensiunea datelor de 
intrare trebuie să găsim o funcție 9(g(n))= f (n) pentru care există constantele 
pozitive c,, c,, my astfel încât 0<c,-g(n)< f(n)< c, - (n) pentru Yn > n. 


e Dacă /(n)= Olg(n)) si (x)= OfA(n))a atunci f(n) = OfA(n)); 
e /(n)=0(/(n); 
e f(n)= 9(g(n)) dacă şi numai dacă g(n)= O(f(n)). 
Notatia O (O mare) 
Trebuie să găsim o funcţie O(g(n))= f(n) pentru care există constantele 


pozitive c, no astfel încât 0 < f(n)< c: g(n) pentru Vn > no. 


e Daca f(n) = O(g(n)) Şi gln) = O(A(n)) atunci fln) = o(h(n)); 
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g(n )) dacă şi numai dacă g(n )= A f (n)); 
e Dacă f(n)=O(g(n)) atunci /(n)= Olg(n)). 


Notatia O mărgineşte superior creşterea timpului de rezolvare a algoritmului 


Notatia 2 (Omega mare) 
Trebuie să găsim o funcție Q(g(n))= f(n) pentru care există constantele 
pozitive c, nọ astfel încât 0 < c-g(n)< f(n) pentru Yn > ng. 
e Dacă f(n)=O(g(n)) si g(n)=O(h(n)) atunci f(n)= O(aln)); 
© /(n)=9(n); 
e f(n)=Q(g(n)) dacă şi numai dacă g(n)= O(f(n)); 
e Dacă /(n)=0(g(n)) atunci /(n)=0(e(n)). 


Notatia Q mărgineşte inferior creşterea timpului de rezolvare a algoritmului 


Notatia o (o mic) 
Trebuie să găsim o funcţie o(g(n))= f(n) pentru oricare c>0 există o 
constantă pozitivă n, astfel încât 0< f (n )<c- g(n pentru Vn > no. 


lim, f(n)/g(n)=0 


e Dacă /(n)=o(g(n)) şi g(n)=o(p(n)) atunci /(n)= ofA(n)); 
e f(n)=0(g(n)) dacă şi numai dacă g(n)= o(/(n)); 


Notatia œ (omega mic) 
Trebuie să găsim o funcţie c(g(n))= f(n) pentru oricare c>0 există o 


constantă pozitivă n, astfel încât 0<c-g(n)< f(n) pentru Yn > n. 
lim, >» /(n)/e(n)= 
e Dacă f(n)= a(g(n)) şi g(n)= o(n(n)) atunci f(n)= o(h(n)); 


e f(n )= olg n)) dacă şi numai dacă g(n )= olf (n )); 


CONSIDERAȚII PRACTICE 

În practică s-a impus tot mai mult utilizarea notatiei O (O mare — „Big 0”). 
Funcție de notația O algoritmii pot primi o caracterizare lingvistică de tipul celor 
prezentate în tabelul următor. 
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Tabelul 7. Tipuri de complexitate 


Caracterizare Notaţia O 
Constant O(1) 
Logaritmic O(log n) 
Linear O(n) 
N log n O(n logn) 
Cuadratic O(n”) 
Cubic Om’) 
Polinomial O(n‘) 
Exponential O(2") sau O(10") 
Factorial O(n!) 
O(n") 


Pentru avea o imagine mai clară a semnificatiei complexității unui algoritm să 
considerăm următorul exemplu ipotetic. Presupunem că avem la dispoziţie un 
calculator care execută fiecare pas al unui algoritm într-o micro-secundă (adică are 
viteza de 1 milion de instrucţiuni pe secundă). Algoritmul va fi executat şi se va opri 
după f (n) instrucțiuni atunci timpul de rulare, funcţie de dimensiunea datelor de 


intrare va fi în conformitate cu tabelul următor. 


Tabelul 8. Exemplu de timp de calcul 


fln) n=2 n=16 n=256 n=1024 | n=1048576 
i 1 us 1 us 1 us 1 us 1 us 
log. n 1 us 4 us 8 us 10 us 20 us 
N 2 us 16 us 256 us 1 ms ls 
nlogzn | 2 us 64 us 2 ms 10 ms 21s 
n 4 us 26 us 66 ms ls 12 zile 
n’ 8 us 4,1 ms 17s 18 min 366000 ani 
g” 2 us 66 ms 10% ani 10% ani | 10°% ani 


Pentru comparație, amintim că din datele cunoscute astăzi soarele va dispărea 
peste doar 5x10? ani. Algoritmii cu complexitate exponențială nu sunt utilizabili în 
practică. Timpii de calcul îi fac utili doar pentru seturi foarte mici de date. Asupra 
algoritmilor cu complexitate factorială sau n la n nu insistăm, funcţia lor de creştere 
fiind mult superioară celei exponentiale. 
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Chiar dacă prezintă dezavantaje evidente, complexitatea exponențială, 
factorială sau n la n este inevitabilă la nivelul actual de cunoştinţe. De exemplu, 
problema comisului voiajor (pe o reţea în care nodurile reprezintă oraşele un vânzător 
trebuie să viziteze toate oraşele exact o singură dată cu costuri minime, cunoscut fiind 
costul călătoriei pe fiecare latură a reţelei) are cea mai bună soluție de complexitate 
exponențială. 


Notatia O, şi in general notatiile de complexitate se aplică problemelor cu 
seturi de date de intrare suficient de mari. Concluziile ce se pot trage pentru 
problemele mari nu se aplică obligatoriu şi problemelor cu dimensiune mică a 
vectorului de intrare. Fiind vor de o notație asimptotică rezultatul este valabil numai 
pentru valori mai mari decât o anumită valoare de prag. 


Pentru probleme mici nu ne vom baza niciodată pe notația O. Vom testa 
câteva implementări şi vom măsura timpul de lucru după care vom selecta unul 
rezonabil pentru clasa de probleme pe care trebui să o rezolvăm în mod practic. 


Trebuie avut în vedere efectele particulare ale mărimii reduse a setului de 
date. De exemplu, un algoritm cu complexitate 1000n este mai scump decât unul n? 
pentru n<1000. alte considerații importante la selecția algoritmilor sunt frecvența de 
utilizare a programului, uşurinţa de scriere a codului, uşurinţa de întreţinere, necesarul 
de memorie etc. 


EXEMPLE DE CALCUL A COMPLEXITĂȚII 


Operații matriciale 

O formă simplă de algoritm, dar esenţială în înţelegerea ideii de complexitate, 
este calculul produsului a două matrice. Presupunând că avem două matrice pătratice 
cu dimensiunea n xn calculul produsului se va face respectând următorii paşi: 


Tipul Număr de 
Operatiei operatii 
Funct MultMatrix ( A[n,n], B[n,n] ) 
For i=l Ton Do Atribuire n 
For j=l Ton Do Atribuire n 
C[i,31=0 Atribuire n 
For k=1 Ton Do Atribuire n 
C[i,j]=C[i,j]+A[i,k]*B[k,j] Atribuire 2n? 
EndFor 
EndFor 
EndFor 
Return C[n,n] 
EndFunct 


Fig. 45 Exemplu de calcul al complexității 
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CLASE DE COMPLEXITATE 


Aşa cum am văzut mai sus, o problemă poate fi rezolvată într-un anumit timp 
a cărui durată depinde de echipamentul de lucru dar şi de dimensiunea setului de date 
de intrare. Dependenţa de datele de intrare defineşte complexitatea algoritmului care 
rezolvă problema. 


Cunoaşterea complexitati ne poate da indicații privind posibilitatea noastră de 
a rezolva problema într-un interval de timp rezonabil pe maşinile de care dispunem. 
Ştiind timpul de rezolvare putem deduce dacă o problemă este tratabilă sau intratabila 
la nivelul actual al tehnologiei. 


Clasa P de complexitate 


Un algoritm este mărginit polinomial când complexitatea în cazul cel mai 
defavorabil este mărginit de o funcție polinomială p care depinde dimensiunea 
m 
setului de intrare n. Funcţia polinomială are forma p(n) = San , unde m poate fi 
i=0 
oricat de mare dar este finit. 


O problemă este mărginită polinomial daca poate fi rezolvată printr-un 
algoritm marginit polinomial. 


Trebuie remarcat ca nu este obligatoriu ca o problema de clasa P sa poata 
avea un algoritm de complexitate acceptabilă. Totuşi, dacă o problema nu este de 
clasă P este inerent intratabilă. 


P este o clasă de probleme decizionale care sunt mărginite polinomial 


Se spune despre probleme de clasă P că sunt rezolvabile polinomial. 


Clasa NP de complexitate 


NP este o clasă de probleme decizionale a căror algoritm aparţine clasei Pdar 
pentru care o soluţie propusă dată pentru un set particular de date de intrare poate fi 
verificată într-un timp mărginit polinomial. 


O problemă este non-deterministic polinomială — de clasă NP dacă: 


° Se determină în mod nedeterministic o soluție; 
° Corectitudinea soluției candidat se poate verifica într-un timp mărginit 
polinomial. 


Rezolvarea acestei clase de probleme are deci două faze. Prima este euristică, 
de „ghicire” a unei soluţii. Soluția nu este obligatoriu unică. De aceea două rezolvări 
succesive sau paralele pot să fie diferite. A doua fază este deterministică, rezultatul 
său fiind totdeauna acelaşi, rezolvând problema prin soluția propusă. 
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Se spune despre probleme de clasă NP că sunt verificabile polinomial. De 
asemenea se consideră că problemele de clasă NP sunt probleme ce pot fi rezolvate 
intr-un timp mărginit polinomial pe o maşină de calcul nedeterministă. 


Este foarte dificil uneori de găsit o soluţie pentru problemele de clasă NP. 
Pentru multe tipuri de astfel de probleme din această clasă se presupune că nu există 
un algoritm mărginit polinomial care să le rezolve. Totuşi datorită complexităţii lor nu 
s-a putut dovedi. 


Clasa de probleme NP-complete 


O problemă decizională este de clasă NP-completă dacă aparţine clasei NP şi 
fiecare problemă din NP poate fi rapid redusă la aceasta. 


Putem spune că problemele NP-complete reprezintă cele mai grele probleme 
din clasa NP. Dacă reuşim să găsim un algoritm mărginit polinomial pentru a rezolva 
o problemă NP-completă atunci putem să rezolvăm toate problemele NP într-un timp 
mărginit polinomial. 


7.5. TEHNICI DE PROIECTARE A ALGORITMILOR 


În rezolvarea de probleme utilizând algoritmi de calcul se pot utiliza mai 
multe metode de abordare. Intre acestea amintim: 


e Reducerea la probleme cunoscute; 

e Abordarea egoistă sau lacomă (greedy approach) 
e Divide şi cucereşte; 

e Programare dinamică; 

e Utilizarea de structuri de date mai bune; 

e Soluţii probabilistice; 

e Soluţii aproximative; 


REDUCEREA LA PROBLEME CUNOSCUTE 


Această tehnică de abordare presupune cunoaşterea şi aplicarea de soluții 
simple rezolvarea problemelor. Problemele mai complexe se pot descompune în sub- 
probleme sau se pot transforma în aşa fel încât să corespundă unei probleme simple. 


Exemplul 1. 
Să se determine într-un tablou toate numerele care se repetă. 


Rezolvarea 1. 


Se compară secvențial fiecare număr cu toate celelalte. Complexitatea în 
acest caz este O(n’). 
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Rezolvarea 2. 


Se sortează tabloul şi apoi se determină dacă numerele vecine au aceeaşi 
valoare. Complexitatea este O(n log n) când se utilizează un algoritm de sortare 
corespunzător. 


Exemplul 2. 


Să se determine dacă oricare trei puncte dintr-un plan sunt situate pe aceeaşi 
dreaptă. 


Rezolvarea 1. 


Se vor încerca grupurile distincte de câte 3 puncte. Complexitatea în acest caz 
este O(n’). 


Rezolvarea 2. 


Se utilizează exemplul 1 de mai sus. Complexitatea este O(n” log n). Se 
calculează panta dreptelor generate de fiecare două puncte din mulțime, se ordonează 
tripletele (punct, pantă, punct) după pantă şi pentru fiecare două triplete consecutive 
cu pantă egală se verifică dacă au un punct comun. 


ABORDAREA EGOISTĂ 


Abordarea egoistă sau lacomă (greedy approach) presupune utilizarea unei 
anumite metode până la epuizare şi apoi, pentru restul problemei, utilizarea până la 
epuizare a unei noi metode. 


Principiile care stau la baza metodei sunt: 


e se alege totdeauna soluţia care pare cea mai bună la un moment dat, şi 
e alegerea optimului local poate conduce la o soluție globală optimă. 


Exemplul clasic se referă la eliberarea unei sume de bani (la bancomat) în 
bancnote de diferite valori. Se eliberează bancnote de valoarea cea mai mare până 
când acest lucru nu mai este posibil, apoi se trece la valoarea imediat următoare până 
când suma se completează. 


DIVIDE ŞI CUCEREŞTE 


Metoda divide şi cucereşte este o metodă eficientă care se bazează pe câteva 
principii foarte simple. Când o problemă este prea complexă, ea va fi împărțită în sub- 
probleme de întindere mai mică, se rezolvă recursiv fiecare sub-problemă şi se 
combină rezultatele. Este o abordare utilizată adesea în problemele care implică 
operaţii cu matrice. 
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Proc Resolve ( P: Problem; R:Result ) 
Declare Pl, P2: Problem 
Declare R1, R2: Result 
If Dimension (P)<=1 
Then 
R:= Direct_result // rezultat direct 
Endif 
Divide P in P1 and P2 
Resolve ( P1, R1 ) 
Resolve ( P2, R2 ) 
Combine ( Rl, R2, R ) 
EndProc 


Fig. 46 Rezolvarea recursivă a problemelor de tip divide şi cucereşte 


Această abordare este eficientă mai ales dacă împărțirea se face de fiecare 
dată în două părți egale. Dificultatea în tipul acesta de algoritmi este de a afla cea mai 
bună cale de a DIVIDE în sub-probleme şi de a face rezultatele să se COMBINE. Nu 
întotdeauna cea mai uşoară metodă de divizare permite adoptarea unei proceduri 
acceptabile de combinare a soluţiilor parţiale într-o soluţie globală. 


Exemplu 


Problema Max-Min. Să se găsească simultan maximul şi minimul unei liste 
de n numere. 


Soluţia banală: se găseşte maximul apoi se găseşte minimul şi se întoarce ca 
rezultat cuplul astfel obținut. 


Divide şi cucereşte: Până când rămân doar două elemente, se împarte lista în 
două sub-liste, şi se obține minimul şi maximul din sub-liste prin apel recursiv. 


Func MaxMin( A, p, r) 
// găseşte max si min in Alp,r] 
If p = r Then Return (A[p], Alp]) 
If p = r-1 
Then 
If A[p] < A[r] 
Then Return (A[r], Alp]) 
Else Return (A[p], A[r]) 
EndIf 
EndIf 
q< (ptr)/2 // împărțire în numere întregi 
(M1,m1) < MaxMin( A, p, q) 
(M2,m2) < MaxMin( A, q+1, r) 
Return (max( M1, M2), min( ml, m2)) 
EndFunc 


Fig. 47 Algoritmul Max-Min rezolvat prin metoda divide şi cucereşte 
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PROGRAMARE DINAMICĂ 

Programarea dinamică este o metodă de rezolvare ce se aplică în cazurile în 
care se caută soluţii optimale ale problemelor pornind de la soluţiile optimale ale sub- 
problemelor în care acestea au fost împărțite. De asemenea se aplică pentru cazurile 
de suprapunere a sub-problemelor: sub-problemele îşi împart sub-sub-probleme. 


Ca principii de bază, acest tip de rezolvare împarte problema generală în 
probleme punctuale ce pot fi mai uşor tratate, combină soluţiile sub-problemelor şi 
evită rezolvarea sub-problemelor mai mult de o dată prin păstrarea soluțiilor anterior 
obținute. 

Se aseamănă cu metoda divizării şi cuceririi prin împărțirea problemei şi 
rezolvarea recursivă dar soluţia se obţine pornind de la rezolvarea unei sub-probleme 
mici şi creşterea ariei de aplicare (bottom-up) şi nu pornind de la problema în 
ansamblu şi apoi particularizând (top-down). Metoda „divide şi cucereşte” nu este 
bună pentru probleme în care soluţia generală de dimensiunea n se bazează pe n sub- 
soluţii de dimensiunea n-l şi nici pentru probleme cu sub-probleme care se suprapun. 


Exemple de domenii în care programarea dinamică se pretează sunt 
înmulțirea unui lant de matrice, aflarea celei mai lungi secvenţe comune a două căi 
într-o rețea etc. 


Exemplu 
Inmultirea eficientă unui lant de matrice — considerăm: 


A = Ap XA XX Aa: 


Fiecare matrice A, are dimensiunile /;x/;, unde 0<i<n. Costul calculării 
produsului 4;,x4;,, este 4 xl Xxl, operaţii. Ordinea în care se efectuează 
inmultierea matricelor într-un lant va duce la valori diferite de operaţii. Astfel, 
considerând 4, 4, A, de dimensiuni 50x5, 5x100, 100x10 numărul de operații 
este: 


e (A, x 4,)x Ay: 50x5x100+ 50x100x 10 = 75000 ; 
e A, x(4 x4): 5x100x10+50x5x10= 7500. 


Se observa ca prin simpla rearanjare a ordinii de efectuare a operatiilor se pot 
realiza economii importante la timpul de calcul. 
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SORTAREA ŞI CĂUTAREA 


8.1. SORTARE 


Necesitatea sortării apare în rezolvarea multor probleme, fie ca cerință de sine 
stătătoare fie ca o facilitate auxiliară. În orice problemă care manipulează un volum 
mare de date, sunt necesare mecanisme pentru regăsire a structurilor de date dorite. 
Funcționarea unor astfel de mecanisme poate fi mai rapidă dacă datele sunt stocate 
într-o ordine prestabilită bazată pe criterii de ordonare. 


Principial, sortarea este un proces în care se introduce ca intrare o secvență 
Adda) şi ca ieşire se obţine o secvenţă B = (by,by,...5b,) care este o 
permutare a lui A cu proprietatea că b <b, <...<b, sau b 2b, >...>b,. Există 
nenumărate modele de sortare fiecare cu diverse variante, toate dezvoltate pe măsură 
ce teoria generală a algoritmilor a evoluat. 


Pentru aranjarea datelor se poate utiliza un criteriu sau mai multe, procesele 
multicriteriale fiind bazate pe procedee dezvoltate din mecanismele de sortare după o 
singură regulă. 


In cele ce urmează vom considera, pentru simplitate, că se utilizează un 
singur criteriu de sortare, lucru ce este mai uşor de înţeles şi urmărit. 


SORTAREA CU „BULE” 

Este o metodă recunoscută ca înceată, dar este deosebit de simplă. Sortarea cu 
bule este una dintre metodele naturale, uşor de înţeles. Un exemplu este prezentat în 
figura următoare. 
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4 3 
a) 3 2 
2 —» 4 
1 1 
3 2 
2 1 
b) 1 3 
4 4 
2 
1 
c) 3 
4 


Fig. 48 Exemplu de sortare cu ,, bule” 


Acest tip de sortare constă in parcurgerea vectorului in care sunt stocate 
datele şi compararea valorilor adiacente. 


In cazul în care se constată că valorile sunt aranjate greşit se face schimbarea 
elementelor între ele. Operatiile se reiau din vârful vectorul până când ordonarea este 
completă. 


Considerând tabloul All---N] care conţine valorile numerice ce trebuie 
ordonate ascendent se efectuează următoarele operaţii: 


. Repetă 
Parcurge A comparând valorile adiacente A[i], A[i+1] 
Dacă A[i] > A[i+1] atunci permută A[i] and A[i+1] 
Până când nu mai există ce permuta 


PUN ed 


Fig. 49 Algoritmul conceptual pentru sortarea cu ,, bule” 


La fiecare ciclu valorile cele mai mari apar la ,,suprafata” precum bulele de 
aer din apă, astfel încât sfârşitul tabloului este sortat (la fiecare ciclu o poziţie), iar 
valorile mai mici sunt deplasate în jos la fiecare ciclu o poziţie. Costul unui astfel de 
algoritm este O(n”). 


Există mai multe versiuni de implementare, una dintre ele este prezentată în 
figura următoare: 
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For i- Dim(A) to 2 
For j- 1 to i-1 
If A[i] > A[i+1] 
A[i] © A[i+1] 
EndIf 
EndFor 1 


Fig. 50 Algoritmul complet pentru sortarea cu ,„ bule” 


SORTAREA CU INSERARE 


Sortarea cu inserare este una dintre cele mai simple metode. A fost imaginată 
din observarea comportamentului jucătorilor de cărți care o aplică instinctiv. Pentru 
acest tip de sortare se scoate un element şi se deplasează cele rămase. Se inserează 
elementul extras în poziția corectă. Aceste operații continuă până când procesul este 
complet. Atât cazul mediu cât şi cazul cel mai defavorabil O(n”) (Knuth 1998 [131]). 


Evident pentru vârful vectorului nu avem ce verificare să facem de aceea se 
porneşte poziția a doua. Elementele de deasupra sunt deplasate în jos până când se 
găseşte poziția corectă pentru elementul extras. Se continuă cu elementul următor 
(poziţia a treia). Procesul continuă prin inserarea fiecărui element la poziția corectă. 


H 
E 


EX 
WE 
| 2 | 


AJU = N |B] Ww »|=|P 
NI =| Alw 


AJwIiInNnj—= 


NIAJ W]e 


Wl 


P 


1 
o B 3 
[4] | 4 | 
| 2 | 


Fig. 51 Exemplu de sortare cu inserare 


N 


Dacă avem un vectorul cu dimensiunea n, utilizând sortarea cu inserare 
trebuie să parcurgem un număr de n-/ elemente. Pentru fiecare, trebuie să examinăm 
şi să deplasăm până la n-l alte elemente. Rezultă o complexitate a algoritmului de 

2 
O(n’). 
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Avantajul acestui tip de sortare este că este un algoritm stabil şi nu necesită 
memorie suplimentară. 


Parcurge vectorul element cu element 
Pentru fiecare element 
Inserează elemental în poziția corectă 
în vectorul cu elemente deja sortate 
Până când ultimul element este introdus în poziția corectă 


Fig. 52 Algoritmul conceptual al sortării cu inserare 


Proc Insert-Sort( A) 
For i + 2 to Dim(A) 
Tmp =- A[i] 
= ad 
While j > 0 and A[j] > tmp 
A[j+1] =- Al] 
J .j=1 
EndWhile 
A[j+1] < tmp 
EndFor 


Fig. 53 Algoritmul complet al sortări cu inserare 


SORTAREA CU SELECȚIE 


Este un algoritm elementar de sortare. Mecanismul său de lucru constă în 
găsirea celui mai mic element din vector şi aducerea sa pe prima poziție. 


4 1 
3 3 
a) I 4 
2 2 
1 1 
3 2 
b) 4 4 
2 3 
1 1 
2 2 
a 3 
3 4 


Fig. 54 Exemplu de sortare cu selecţie 
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Algoritmul conceptual al sortării cu selecție este prezentat în figura 
următoare: 


Parcurge vectorul element cu element 
Pentru vectorul neordonat 

Găseşte minimul 

Aduce minimul pe prima poziție 
Până când vectorul este complet ordonat 


Fig. 55 Algoritmul conceptual al sortării cu selecţie 


Pornind de algoritmul conceptual se poate scrie algoritmul complet pentru 
sortarea cu selecție. 


Proc Select-Sort( A ) 


For i - 1 To Dim(A)-1 
Min e i 
For j - itl to N 
If A[Min] > A[j] 
Then 
min e j 
EndIf 
EndFor 
A[Min] ® A[i] 
EndFor 


EndProc 


Fig. 56 Algoritmul complet al sortării cu selecție 


Presupunând că vectorul de intrare are dimensiunea n, complexitatea 
: A 2 
algoritmului este O(n”). 


SORTAREA SHELL 


Acest tip de sortare a fost dezvoltat de Donald L. Shell. Acest algoritm 
încearcă îmbunătăţirea eficienţei sortării cu inserare prin deplasarea rapidă a valorilor 
către destinaţia lor. Acest algoritm are complexitate O(n“) în medie şi O(n**) în 
cazul cel mai defavorabil (Knuth 1998 [131]). 


Aceasta este prima încercare de algoritm de sortare care a reuşit să coboare 
sub complexitatea O(n’). Scopul este de compara şi dacă este necesar să schimbe 
poziţia pentru elementele care sunt mai depărtate în tablou. 


Considerăm exemplul din figura următoare: 
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Fig. 57 Comparaţie între sortarea cu insertie si sortarea Shell 


De fiecare dată când se schimbă între ele două elemente aflate la distanţa k se 
elimină un număr de k inversiuni. Aceasta permite înlocuirea a mai mult de o 
inversiune pe fiecare pas. Ideea este de a efectua sortarea cu inserare numai peste 
anumite elemente din tablou. Aceste elemente trebuie să fie alese cât mai depărtate 
unul de altul. În acest moment se vorbeşte de valoarea de incrementare. Pentru o 
valoare particulară a incrementului, de exemplu A, toate elementele situate la distanța 
h se sortează utilizând algoritmul cu inserare. Aceasta conduce la câteva sub-tablouri. 
După fiecare sortare Ali] < Ali + h] pentru toate valorile i. 


Sortarea utilizează o serie de valori de incrementare care continuă atât timp 
cât incrementul este mai mare sau egal cu 1. Dacă secvența de incrementare este 
aleasă corespunzător viteza este deosebit de mare. 


În cadrul metodei sortării cu insertie (a) mai întâi extragem 1 şi deplasăm 
valorile 3 si 5 cu o poziţie (în total două deplasări). În următoarea trecere sunt cerute 
tot două deplasări pentru a insera 2. În ultima evaluare se efectuează o singură 
deplasare. În total se fac 5 deplasări. 


Simultan se prezintă şi sortarea Shell (b). Începem cu o distanţă de 2. 
Comparăm numerele 3 şi 1. Se extrage 1 şi se deplasează în sub-sir cu o poziţie în jos. 
Următoarea comparare este între 5 şi 2. Se extrage 2 şi se deplasează 5 cu o poziţie 
mai jos, inserând 2. după încheierea sortării cu intervalul 2 se trece la incrementul 1. 
În total vor fi 3 deplasări. Deci mai puţin decât sortarea cu inserare clasică. 
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Proc Shell Sort( A, n) 


Declare incr, I, j integer 
Declare t 


Incr « n/2 
While incr < n 
I « incrt+l 
While i < n 
t - A[i] 
qe a 
While j > incr 
If t<A[j-incr] 
Then A[j] - A[j-incr] 
Else ExitWhile 
EndIf 
jJ- j - incr 
EndWhile 
A[j] =- t 
n IND SE n a N 
EndWhi le 
incr + incr/2 
EndWhile 
EndProc 


Fig. 58 Algoritmul de sortare Shell 


nn As eo ees . f 
Secvența aceasta de yp nu este cea mai rapidă soluție. Funcție de 


dimensiunea vectorului de intrare, se pot găsi secvențe de valori de incrementare care 
aduc viteza maximă. 


SORTAREA RAPIDĂ (QUICKSORT) 


Deşi sortarea Shell este semnificativ mai bună decât sortarea cu inserare se 
mai pot face îmbunătăţiri. Una dintre metodele populare este sortarea „rapidă”. 
p ! pop „rap 


Sortarea rapidă este un exemplu clasic de algoritm de tipul divide şi 
cucereşte. 


Algoritmul de sortare funcționează prin partitionarea tabelului ce urmează a fi 
sortat şi apoi prin apelarea recursivă a sortării rapide. În procedura de partitionare se 
alege drept pivot unul dintre elementele tabelului. Toate valorile mai mici sunt 
deplasate în stânga şi toate elementele mai mari în dreapta. 


În medie, complexitatea este O(n Inn). 


Acest are forma: 
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Proc QuickSort (A:List; Lb, Ub: Integer) 
if Lb < Ub 
then 
M = Partition ( A, Lb, Ub ) 
QuickSort (A, Lb, M- 1) 
QuickSort ( A, M, Ub ) 
EndIf 
EndProc 


Fig. 59 Algoritmul de sortare rapidă 


Important este modul în care se realizează împărţirea listei în două sub liste. 
Pentru funcția care realizează acest lucru — Partition există mai multe formate. Unul 
dintre modurile de realizare este prezentat conceptual în figura mai jos. 


Funcția Partajare 


Selectează un pivot din A[Lb]... A[Ub] 
Reodonează A[Lb]..A[Ub] aşa fel încât 
toate valorile din stânga pivotului sunt < pivot 
toate valorile din dreapta pivotului sunt > pivot 
Returnează poziția pivotului; 
Fig. 60 Algoritmul conceptual pentru funcţia de partajare 


Pornind de la conceptul prezentat mai sus se poate concepe un exemplu de 
algoritm complet pe care în prezentăm în figura următoare. 


Funct Partition (A:List; 
Lb, Ub: integer) :integer 
x - A[Ub] 
Tce GED: i= sali 
For j - Lb To Ub-1 
If A[j]<x Then 


i o itl 
Afi] ® A[j] 
EndIf 
EndFor 
A[i+1] ®© A[Ub] 
EndFunct 


Fig. 61 Algoritm complet pentru funcția Partition 


In algoritmul de mai sus semnul are © semnificaţia de permutare, de 
schimbare între ele a valorilor celor două variabile. 


Un exemplu de sortare rapidă este prezentat schematic în figura de mai jos: 
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Lb Ub 


pivot 


1[2][3]5] 4] ac 
Sr —_~\ 


Fig. 62 Exemplu de sortare rapida 


Dezavantajele acestei metode sunt date de utilizarea de memorie suplimentara 
si complexitatea in cazul cel mai defavorabil (O(n?)). Totusi cazul cel mai 
defavorabil este putin probabil să se manifeste (Cormen 1990 [129]). 


SORTAREA CU COMBINARE (MERGE SORT) 

Acest tip de sortare se bazează pe împărţirea vectorului de intrare in două 
parti egale. Cele două parti se tratează recursiv prin sortare cu combinare după care se 
combină rezultatul sortării. 


Proc MergeSort( E: List; first, last: integer ) 
Declare m Integer 
If (first < last) 
Then 
m e (firstt+last) /2 
MergeSort( E, first, m ) 
MergeSort( E, m+1, last ) 
Merge( E, first, m, last ) 
EndIf 
EndProc 


Fig. 63 Algoritmul de sortare cu combinare 


Importantă este partea combinare efectuată de procedura merge () care este 
apelată de procedura prezentată mai sus. Combinarea a două liste sortate de câte n/2 
elemente necesită n-l comparări în cel mai defavorabil caz. Acest lucru se face 
pornind de la începutul fiecărei liste şi eliminând în fiecare iteratie cel mic element 
care se adaugă la lista finală. 


Considerând L1 şi L2 liste de intrare şi L lista de ieşire, algoritmul conceptual 
este prezentat în figura următoare. 
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Procedura Combinare (L1, L2, L:Lista) 
// L1, L2 sunt liste de intrare 
// L Lista de ieşire 


Cat timp Ll nu este vidă si L2 nu este vida 
Dacă primul element din L1 < Dacă primul element din L2 


Atunci 

extrage primul element din L1 şi îl introduce in L 
Altfel 

extrage primul element din L2 si il introduce in L 


timp L1 nu este vidă 
xtrage primul element din Ll şi îl introduce in L 
timp L2 nu este vida 
Extrage primul element din L2 si il introduce in L 


ad Fl ct 


Fig. 64 Algoritmul de combinare pentru sortarea cu combinare 


24 | 32 | 36 | 29 | 15 | 10 | 23 


10 | 15 | 23 | 24 | 29 | 32 | 36 
Fig. 65 Exemplu de sortare cu combinare 


SORTAREA CU NUMĂRARE (COUNTING SORT) 


Se presupune că toate cele n element sunt întregi şi cuprinse în intervalul de 
la 0 la k. 


Pentru fiecare element de intrare se numără elementele mai mici. In final se 
plasează elementul chiar în poziția corectă. 
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Sortare şi căutare 


Dacă vom considera lista de intrare ca fiind X şi lista de ieşire Y (nu se face 
sortarea direct în lista de intrare şi este nevoie de spațiu suplimentar), atunci 
algoritmul are următoarea formă: 


Proc counting sort( x,y:List,n,k:Integer) 
Declare z:List // zonă de lucru temporară 


For 
For 


i-0 to k-1 z[i] - 0 
3-0 to n-1 z[x[j]] =- z[x[j]]+1 
// z[i] conține numărul d lement gale cu i 


For i-l to k-1 z[i] « z[i] + z[i-1] 
// z[i] conţine numărul de elemente Si 
For j-n-l to 0 
ylz(x{j]]] = x); zlx(3lle 2[x[3]]=1; 
EndFor 
EndProc 


Fig. 66 Algoritmul pentru sortarea cu numărare 


Complexitatea algoritmului de sortare cu numărare este O(n). 


SORTAREA RADIX 

Acest tip de sortare lucrează cel mai bine cu valori întregi şi presupune 
ordonarea valorilor funcție de cifra cea mai putin semnificativă, apoi funcţie de 
următoarea şi tot aşa până când se ajunge la cifra cea mai semnificativă. 


967 952 952 159 
952 352 352 167 
369 967 159 352 
352 167 967 369 
167 369 167 952 
159 159 967 


369 
Pr N Pr 
Fig. 67 Exemplu de sortare radix 


Sortarea radix se bazează pe baza de numerație (sau rădăcina = radix) a 
reprezentării numerelor. Problema este dată de faptul că utilizează memorie 
suplimentară dar acest supliment este scăzut dacă se lucrează cu structuri dinamice. 


Cheia este utilizarea unei tabele de dispersie cu dimensiunea 10 (pentru baza 
de numerație 10). 


Complexitatea este de tipul O(n) numărul exact de iterații depinzând de 


numărul maxim de cifre pe care îl au valorile ce se sortează. 


140 


Baze de date şi algoritmi pentru căi de comunicație 


SORTAREA CU GRĂMEZI (BUCKET SORT) 


Se presupune că cele n valori de sortat sunt situate într-un interval oarecare. 
Se împarte intervalul in M sub-intervale egale. Se creează M grămezi fiecare 
corespunzând respectiv câte unui sub-interval. Se consideră pe rând valorile de sortat 
şi se introduc în grămada corespunzătoare. Se ordonează fiecare grămadă prin 
sortarea cu inserare. 


În final se concatenează în ordine grămezile pentru a obţine rezultatul dorit. 
Considerând un şir de m valori Ali] cu proprietatea că 0 < A[;]<1 şi că s-au 
creat n grămezi G| j| unde j= 0,...,n—1 un model algoritm de sortare cu grămezi 


poate fi cel din exemplul următor: 


Funct BucketSort (A:List) 
Pentru I « 1 lam 
Insereaza A[i] in G[j] unde 
ste parte întreagă din n*A[i] 
Pentru j - 0 la n-1 Sortare G[j] 
Concatenare G[0]...G[n-1] 
EndFunct 


Fig. 68 Algoritm pentru sortarea cu grămezi 


În medie complexitatea este O(n). 


8.2. CĂUTAREA 


CĂUTAREA DATELOR NEORDONATE 


Pentru date neordonate nu prezintă un interes special. Ea se rezumă, pur şi 
simplu, la parcurgerea secventiala a listei până când se întâlneşte valoarea căutată. 


3 | Lb 


40 
41 
55 | Ub 


Fig. 69 Exemplu de listă 


oN aoun AUNG 
N 
Ko) 


Presupunând că datele se află stocate într-un vector nesortat de dimensiune 8 
numărul maxim de comparații pe care le poate face căutarea secventiala este 8, deci 
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complexitatea este O(n) în cel mai defavorabil caz. Făcând prezumția unei distribuții 


perfect aleatoare în medie numărul de paşi va fi n deci complexitatea este tot O(n). 


In continuare prezentăm algoritmul pentru căutare secventiala. 


Funct SequentialSearch ( A: array; 
Lb, Ub: integer; 
key: Integer): integer; 
For I + Lu to Ub do 


If A[i] = Key then 
Return i 
EndIf 
EndFor 
Return -1 
EndFunct 


Fig. 70 Algoritmul pentru căutarea secventiala 


Evident căutarea secventiala este ineficientă şi este dovada faptului că datele 
nu trebuie păstrate niciodată fără să fie ordonate. 


CAUTARE BINARĂ 


Dacă există certitudinea că valorile au fost ordonate se poate utiliza căutarea 
binară. Acest tip de căutare implică alegerea elementului median şi împărțirea restului 
de elemente în două: submultimea celor mai mici şi submultimea celor mai mari. 
Dacă valoarea căutată este egală cu elementul median considerat ca pivot căutarea s-a 
încheiat. Dacă valoarea este mai mică respectiv mai mare atunci limitele mulțimii de 
căutare se ajusteaza la limitele submultimii corespunzătoare. Operația se reia până 
când se găseşte valoarea sau mulțimea elementelor rămase este vidă. 


Funct BinarySearch ( A: array; 
Lb, Ub: integer; 
key: Integer): integer 
Repeat 
M — (Lb*Ub) /2 
If key<A[M] then Ub e M-1 
Else If key>A[M] then Lb - M+1 
Else 
Return M 
EndIf 
Until Lb > Ub 
Return -1 
EndFunct 


Fig. 71 Algoritmul pentru căutarea binară (varianta iterativă) 
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Algoritmul poate fi prezentat în forma iterativă ca în figura de mai sus sau în 


forma recursivă prezentată în figura următoare. 


Funct BinarySearchR ( A: array; Lb, Ub: integer; 


key: Integer): integer 

If Lb > Ub Then 

Return -1 
EndIf 
M — (Lb*Ub)/2 
If key<A[M] then Return BinarySearchR (A,Lb,M-1,Key) 
Else If key>A[M] then Return BinarySearchR (A,M+1,Ub, Key) 
Else Return M 
EndIf 


EndFunct 


Fig. 72 Algoritmul pentru căutarea binară (varianta recursivă) 
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GRAFURI SI PROBLEME PE GRAF 


9.1. ELEMENTE DE TEORIA GRAFURILOR 


Istoric vorbind, teoria grafurilor începe în 1736 când Euler prezintă o teorie 
generală în care include şi rezolvarea „problemei podurilor din Königsberg”. Ulterior 
această teorie s-a dezvoltat din considerente practice. Nevoia de a stabili metode de 
minimizare a costurilor mijloacelor de transport, de comunicație, de aflare a drumului 
critic (acestea fiind doar câteva exemple) au impus implicarea teoreticienilor. 


DEFINIȚII 

Graful este un obiect matematic care este format din tripletul (N Af ) unde 
N este un set de puncte (vârfuri sau noduri) şi A este un set de muchii (laturi sau arce), 
iar f este o funcţie de conexiune f: 4+» N xN . Funcţia f stabileşte corespondența 
dintre fiecare arc punctele sale terminale din care cauză mai este numită funcția arc— 
terminatii (edge-endpoint function). A este un sub-multiset din NxN, aceasta 
deoarece pot exista mai multe arce care să conecteze o pereche dată de noduri. In 
general, funcția f se consideră implicit şi graful se notează G = (N ; A). 


Numărul de noduri ale unui graf, notat [e „ reprezintă ordinul grafului. 


Numărul de muchii se notează |G]. Functie de ordinul sau, un graf poate fi finit sau 
infinit. Daca intr-o problema nu se specifica altfel atunci se considera ca graful este 
finit. Graful de ordinul 0 se numeste graf vid. Graful de ordinul 0 sau 1 se numeste 
graf trivial. 
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Conexiunile descrise prin setul de arce A pot fi orientate sau neorientate. 


Un graf (sau graf neorientat sau graf nedirectionat sau graf ordinar) G 
constă într-un set N de noduri şi un set A de arce dispuse în aşa fel încât fiecărui arc 
aeéA i se asociază o pereche neordonată de noduri p sig unde peN şi geN. 
Dacă există un arc unic a asociat cu nodurile p şi q vom scrie a =(p,q) sau 
a = (q, p). În practică se întâlnesc adesea grafurile neorientate cum ar fi rețeaua de 
drumuri județene. 


Un graf direcționat (sau graf orientat sau digraf) G constă într-un set de set 
N de noduri şi un set A de arce dispuse în aşa fel încât fiecărui arc a e A i se asociază 
o pereche ordonată de noduri p şi q unde peN şi ge N. Dacă pentru un arc a 


asociat cu nodurile p şi q vom scrie a = ( ; q) rezultă că arcul are direcția de la p la q. 
Pentru a= (q, p) arcul a are direcția de la q la p. 


Un exemplu de graf orientat este alimentarea cu apă într-un oraş, unde apa 
poate circula numai de la furnizor spre consumatori niciodată invers. De la 
consumatori se adună reziduurile prin rețeaua de canalizare, un alt exemplu de graf 
direcționat (cel puţin în teorie). 


Deoarece setul A al arcelor este descris prin perechile corespunzătoare de 
noduri terminale, în practică, notația generală pentru un graf G (direcționat sau 
nedirectionat) care este alcătuit din setul de arce A pe setul de noduri N este 
G= (N A). De cele mai multe ori funcţia f este omisă în reprezentare şi este tratată 
implicit, ea fiind o simplă relaţie. De asemenea, se consideră implicit că A este o 
mulțime finită, iar N este diferit de mulțimea vidă. 


Două noduri p şi q unite de un arc a sunt noduri adiacente sau vecine. Daca 
toate nodurile sunt adiacente între ele atunci graful este complet. 


Un arc a, care uneşte o pereche de noduri p şi q este incident pe p şi q. 
Despre p şi q se spune că sunt incidente la arcul a. Nodurile p si q sunt capetele 
muchiei a. 


Din definițiile anterioare nu rezultă necesitatea ca p $i q care descriu arcul 
a=(p,q) să fie distincte. Avem deci posibilitatea ca un nod să fie conectat la el 


însuşi printr-un arc. O astfel de construcţie a = ( Pp, p) se numeşte buclă. 


De asemenea, nu este obligatoriu ca arcul, orientat sau neorientat, care 
conectează două noduri să fie unic. Dacă există mai multe arce similare care 
conectează aceleaşi noduri se spune că sunt arce paralele. 


Dacă un graf nu are bucle şi nici arce paralele se numeşte simplu. Aici trebuie 
notat că arcele orientate ce conectează aceleaşi două noduri dar în sens invers nu sunt 
considerate paralele. 
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Prin definiţie: 

GUG'=(NUN', AU 4") şi 

GAG =(NON',AN A). 

Dacă GOG'=¢ atunci G si G' sunt disjuncte. 


Dacă N'c N şi A'< A atunci G' este un sub-graf al lui G (sau G este un 
super-graf al lui G'). 

Dacă G'<G şi G' conţine toate muchiile pge A cu p,qeN' atunci G' 
este un sub-graf indus al lui G. Se spune că N’ induce sau acoperă G’ pe G 
(G' =: GIN J. Astfel, dacă Mc N este un set de noduri, atunci G|M | reprezinta 
graful pe M ale cărui muchii sunt acele muchii din G cu ambele capete in M. 
Graful G'<G este un sub-graf acoperitor al lui G dacă N' acoperă tot G 
(N'=N). 


Graful ponderat este acel graf pentru a căror elemente se ataşează valori de 
pondere. Aceste valori pot fi ataşate fie la muchii fie la noduri. Pentru muchii se pot 
ataşa viteze, timpi de întârziere, fluxuri etc. Pentru noduri se pot ataşa de exemplu 
datele despre populația pentru oraşe. 


GRADUL UNUI NOD 

Considerăm G = (N , A) un graf nevid. Mulțimea vecinilor unui nod p €N 
este notată cu V;(p) sau pe scurt V(p). Dacă în locul unui singur nod considerăm o 
submulțime M c N , vecinii din N\M ai nodurilor din M se numesc vecinii lui 
M si mulţimea lor se notează V(M ). 


Considerând un nod p , numărul de arce care sunt incidente pe nod |A(p) da 


gradul sau valența acelui nod. Daca un nod nu este conectat de nici un arc atunci 
gradul său este 0. Spunem că acest nod este izolat. 


Dacă toate nodurile din graf au acelaşi grad se spune că graful este regulat. 
Gradul total al unui graf este dat de suma gradelor tuturor nodurilor. 


Într-un graf neorientat gradul grafului este de două ori numărul arcelor. 
Pentru un graf orientat gradul său este dat de suma arcelor care intră pe fiecare nod, 
asta însemnă în total numărul arcelor. 


Un graf în care toate perechile de noduri sunt adiacente se numeşte graf 
complet. 
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Un graf G = (N i A) in care multimea nodurilor sale poate fi impartita in doua 
submultimi disjuncte in asa fel încât nici un arc nu are ambele terminatii în aceeaşi 
submulțime. Dacă numărul de noduri este k atunci numărul de arce este Cy . 

Un graf bipartit care are numărul maxim posibil de arce se numeşte graf 


bipartit complet. Numărul total de arce este in acest caz , nxm unde n şi m 
reprezintă numărul de noduri din fiecare dintre submultimi. 


DEFINIȚII SUPLIMENTARE 

Un traseu (walk) într-un graf G = (N ; A) este o secvență finită de noduri şi 
arce adiacente între un nod de pornire nọ şi un nod de final n,: 
Aon = (n.n, ale Ai =0,....4—1. Traseul trivial constă dintr-un singur nod. 


Lungimea traseului într-un graf este dată de numărul de arce L, =k. 


O cale sau un drum (path) este un traseu care porneşte dintr-un nod de start 
no Şi se încheie în nodul final n, şi nu conţine arce care se repetă. O cale simplă între 
No ŞI n, nu conţine noduri care se repetă. Deoarece o cale este un traseu, lungimea 
unei căi este dată de definiţia din paragraful anterior. 

Un graf G se numeşte conectat dacă pentru oricare pereche de noduri n, şi 
n, există un traseu care porneşte din n, şi se încheie în n, . În caz contrar graful este 
neconectat. Într-un graf conectat există o cale între oricare două perechi de noduri. 


Dacă într-un graf conectat, o punte (engl. bridge) este un arc a cărui eliminare 
transformă graful într-un graf neconectat. 


Un traseu se numeşte închis dacă primul şi ultimul nod din secvenţă sunt 
identici. Un traseu închis care conține cel putin trei arce şi nodurile sunt distincte, cu 
excepția primului şi ultimului, se numeşte ciclu. 


Două noduri sunt puternic conectate sunt noduri pentru care există o cale pe 
graf de la fiecare către celălalt. Graful puternic conectat este acel graf în care oricare 
două noduri sunt puternic conectate. 


9.2. REPREZENTAREA GRAFURILOR 


REPREZENTAREA GRAFICĂ 


Este o reprezentare utilă pentru raționamentul mintal al oamenilor. Pe 
asemenea reprezentări se pot uşor observa legături reale sau potenţiale. Este un suport 
pentru euristică şi intuiţie. Faptul că este atât de uşor de înțeles face ca acest tip de 
reprezentare să fie cel mai popular. 
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Nodurile şi arcele sunt reprezentate în plan prin puncte şi linii. Dacă un arc 
este orientat se adaugă o săgeată în capătul care arată direcție 


În total putem distinge patru tipuri de grafuri: 


e Grafuri: nu există restricții legate de bucle şi arce paralele; 

e Grafuri simple: nu sunt permise bucle şi arce paralele; 

e Grafuri orientate: toate arcele sunt orientate şi nu există restricţii legate de 
bucle şi arce paralele; 

e Grafuri orientate simple: toate arcele sunt orientate şi nu sunt permise bucle şi 
arce paralele. 


A = 


Fig. 73 Graf 


AY 


Fig. 74 Graf simplu 


re 
® 
Y 


Fig. 75 Graf orientat 


e 


148 


Baze de date şi algoritmi pentru căi de comunicaţie 


>» 


a, 


Fig. 76 Graf orientat simplu 


Exemple 
În viaţa cotidiană avem foarte multe cazuri concrete ce pot fi reprezentate 
prin grafuri. 


Un astfel de exemplu de reprezentare prin grafuri poate fi conectarea 
calculatoarelor dintr-o instituţie. In noduri sunt figurate calculatoarele, fie ele servere 
sau staţii de lucru iar arcele reprezintă conexiunile cablate. 


LEGENDĂ 


A Server 


e Staţie de lucru 
Fig. 77 Graf reprezentând conectarea calculatoarelor 


Alt exemplu poate fi constituit de reţeaua de cale ferată ce uneşte localităţile 
dintr-o regiune. În noduri se situează localităţile iar arcele sunt liniile de cale ferată. 
Intre unele noduri pot fi figurate arce paralele dacă linia este dublă sau triplă. 
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ORAŞ 3 


Cale ferată 


ORAŞ 2 


Cale ferată 1 


ORAS 1 
Fig. 78 Exemplu de graf reprezentând rețeaua de cale ferată dintr-o regiune 
Reprezentarea utilizând grafurile nu este obligatoriu să se facă numai pentru 


situația când atât nodurile cât şi laturile sunt entităţi fizice. Se poate imagina un graf a 
persoanelor care se cunosc între ele. 


l 7 8 


Fig. 79 Graful relațiilor dintre persoane 


Graful prezentat în figura anterioară poate fi chiar orientat căci există cazuri 
frecvente când în relația dintre două persoane numai una cunoaşte pe cealaltă. 


Pentru o rețea de drumuri în care fiecare segment are o anumită lungime 
există un anumit număr de maşini de intervenţie situate în câteva localități importante. 
O astfel de situație este reprezentată în figura următoare. 
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Fig. 80 Exemplu de graf ponderat 


Numerele ataşate nodurilor reprezintă numărul de maşini care sunt 
disponibile în fiecare localitate. Muchiilor li se ataşează distanţa între localități. 


REPREZENTAREA PRIN STRUCTURI DE DATE 


Dacă reprezentarea grafică nu prezintă probleme deosebite, reprezentarea în 
memoria calculatorului nu mai este atât de simplă. Aceasta deoarece trebuie ținut cont 
de spaţiul efectiv de stocare dar şi de timpul de prelucrare a datelor. 


Există două căi principale de reprezentare a grafurilor: prin matricea 
adiacentelor şi prin liste de adiacente. 


Considerând un graf neorientat a cărui noduri sunt notate de la 1 la 6, 
reprezentarea sa poate fi văzută în figura următoare: a) forma matriceală şi b) lista de 
adiacenta. 


123456 1 [+e +14] He] 
0 1 0 1 0 1 2 DEBA 

o pita ao eee 

i dE E ENE a EI ZA 
101010 Lis 
001101 SLABI LHe] 
10001 0 sH] 


Fig. 81 Reprezentarea unui graf neorientat 


Pentru reprezentarea prin matricea adiacentelor în poziția (i,j) s-a notat cu 1 
faptul că nodurile i şi j sunt adiacente. Valoarea 0 indică inexistenţa unei muchii care 
să unească nodurile i şi j. 
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Similar putem reprezenta un graf orientat. 


O o oome OF 


OC OG 9 O 9 9» 


3 4 
01 
1 0 
0 0 
1 0 
0 0 
0 0 


oOo FF Oo OM 


O = 9 E 9 => 


b) 


Fig. 82 Reprezentarea unui graf orientat 


SETE 
2 +|: =| 3 |/ 
3 [ZI 

4 +| +|5//] 
om KAVA 
64 


Din figura de mai sus, se observă imediat că spre deosebire de graful 
neorientat, reprezentarea matriceală a grafului orientat nu mai este obligatoriu 


simetrică. 


Dacă graful este ponderat, atunci pe lângă indicatia existenţei unei legături 
între două noduri se indică şi ponderea (sau distanţa, costul etc.) acelei legături. Acest 
lucru se poate face tot prin utilizarea matricei adiacentelor şi a listei de adiacenta. 
Lista de adiacenta trebuie să conţină pe lângă numărul nodului şi valoarea care indica 


ponderea. 


0 35 
35 0 
co 40 
25 œ 
00 œ 


60 æ 


25 


I-24 S5 6 


b) 


= 


NU A W N 


60 


48 


30 


Fig. 83 Reprezentarea unui graf ponderat 


Similar se poate reprezenta un graf ponderat orientat: 


60 km 


8 8 © 8 8 


8 8 8 8 


20 


Fig. 84 Reprezentarea unui graf ponderat orientat 


NINDA 
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Şi în acest caz matricea adiacentelor nu este obligatoriu simetrică. 


In cazul reprezentării grafurilor trebuie să stabilim cantitatea de memorie 
necesară. Presupunând un număr de n noduri şi m arce rezultă: 


e În cazul matricei adiacentelor costul (în termeni de memorie) este n? ; 
e Pentru liste de adiacență costul este n+2m pentru grafuri neorientate şi 
n + m pentru grafuri orientate 


Deci reprezentarea cu ajutorul listelor de adiacenta este mai eficientă decât 
utilizarea matricelor. De aceea este preferabilă folosirea listelor în reprezentarea, 
modelare şi rezolvarea problemelor în grafuri. 


9.3. ARBORI 


Un graf aciclic se numeşte pădure. O pădure conectată se numeşte arbore. Un 
nod al unui arbore a cărui grad este 1 se numeşte frunză. Un arbore netrivial are cel 
puţin 2 frunze. 


Proprietăţi ale arborilor 


Dacă un graf G = (N, A) este arbore atunci: 


e G nuare cicluri dar adăugarea unui arc între două noduri neadiacente va crea 
unul; G este aciclic maximal. 

e Există o singură cale între oricare pereche de noduri; 

e G este conectat dar eliminarea oricărui arc îl va transforma în graf 
neconectat; G conectat minimal. 

e Dacă G are k noduri atunci el are exact k —1 arce. 


ARBORELE DE ACOPERIRE 
Arborele de acoperire pe un graf nedirectionat G = (N , A) este un subset de 


arce TC A care nu conţine bucle, este aciclic şi conectează toate nodurile din N. 
Din condiţia de mai sus rezultă că dacă există n noduri arborele de acoperire va 
conține exact n—1 arce. 


Presupunem că există o funcţie a costurilor c: 4— Z, unde Z este mulțimea 
valorilor costurilor şi noțiunea de cost trebuie privită în sens larg, nu strict monetar. 
Costul total pentru arborele T este suma costurilor arcelor: 


c(T) = > cla) 


aeT 
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PROBLEMA ARBORELUI DE ACOPERIRE MINIMAL 

Considerând o rețea (N, A), cu costurile cy asociate arcelor (i, j)e A să se 
gaseasca arborele de acoperire cu costul cel mai mic. 

Exemplu: pe o reţea existentă (de drumuri sau de cale ferată) se pune 


problema de a se proiecta un nou sistem de comunicaţie (cu fibră optică etc.) care să 
conecteze un set de locaţii importante (cum ar fi districtele) la un cost minimal. 


Teoremă: Fie U un subset corespunzător al setului de noduri N. Dacă (u,v) 


este arcul cu costul cel mai mic astfel încât ueU şi ve N\U atunci există 
un arbore de acoperire minimal care include arcul (u,v). 


Demonstraţie: Să presupunem că nu există nici un arbore de acoperire 
minimal care să includă arcul (u,v). Fie T un arbore de acoperire minimal oarecare. 
Adăugând (u,v) la T vom introduce un ciclu (T este arbore de acoperire). În 
consecință, există un alt arc (u',v’) in T astfel încât u'eU şi v'e N\U. Daca nu, ar 
fi imposibil să realizăm un ciclu între u şi v fără să parcurgem de două ori arcul 
(u,v). 

Stergand arcul (u v') întrerupem ciclul şi obținem un arbore de acoperire T’ 
a cărui cost nu este mai mare decât T de vreme ce am presupus din start că c,, Sc. 
Deci, T’ contrazice presupunerea că nici un arbore de acoperire minimal nu include 
arcul (u,v). 


Algoritmul generic de aflare a arborelui de acoperire minimal este dat de: 


Proc AMA Generic( G, cost ) 


T- Ø 
Cât timp T nu este arbore de acoperir 


Caută arc (u,v)eG-T astfel încât 
ueT si cost(u,v) minimal 
T-TU (u,v) 


Fig. 85 Algoritmul generic pentru găsirea arborelui minimal de acoperire 


Algoritmul lui Prim pentru arborele minimal de acoperire 


In cadrul algoritmului lui Prim, X reprezintă un arbore unic şi S setul de 
noduri ale acestui arbore. In fiecare iteratie se adaugă arborelui câte un nou nod pana 
când toate nodurile sunt cuprinse. 


Algoritmul conceptual este prezentat mai jos. 
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Proc AMA Prim ( G, cost ) 


Alege un nod de start s 
Toc ({s}, Ø) 


Cât timp V[T] # V 
Caută cel mai ieftin arc (u,v) 
care conectează T de G-T 
//la egalitate alege aleator 
T - TU({v},{ (u,v) }) 
Returneaza T 


Fig. 86 Forma conceptuala a algoritmului lui Prim 
Algoritmul lui Prim este de tipul O(n? ). 


Algoritmul lui Kruskal 


Pentru rezolvarea problemei arborelui minim de acoperire algoritmul Kruskal 
utilizează o abordare diferită de algoritmul Prim. În loc să dezvolte un arbore unic, 
algoritmul Kruskal selectioneaza cele mai arcele cu costul cel mai mic dezvoltând câți 
arbori sunt necesari, arbori ce în final se vor uni în procesul de adăugare de noi arce. 


Iniţial fiecare nod din graf este considerat ca un arbore trivial. 


Proc AMA Kruskal ( G, cost ) 


T - (N, Ø) 
Ordonează arcele în ordine ne-descrescătoare 


Pentru fiecare (u,v)eAl[G] (ordonate) 
Dacă u,v sunt în diferite 
componente conectate ale lui T 


T-T U {(u,v)}) 


Returnează T 


Fig. 87 Forma conceptuala a algoritmului lui Kruskal 


Algoritmul lui Kruskal are complexitatea O(m log m), unde m este numărul 
de arce. 


Exemple de utilizare a algoritmilor de găsire a arborelui de acoperire minimal 
sunt prezentate mai jos. Se poate observa modul de acțiune şi deosebirile dintre cele 
două abordări. Considerăm un caz particular dat de un graf cu 9 noduri şi 12 arce cu 
costurile prezentate în figura următoare. În continuare prezentăm dezvoltarea 
arborelui de acoperire minimal prin algoritmul Prim şi prin algoritmul Kruskal . 
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Fig. 90 Rezolvare cu algoritmul Kruskal 
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9.4. PARCURGEREA GRAFURILOR 


Parcurgerea grafurilor trebuie făcută într-o manieră organizată, sistematică 
pentru a nu scăpa noduri sau arce. Există două tehnici importante: 


e Căutare pe orizontală (breadth-first search): se caută să se obțină maximum 
de lărgime din examinarea unui nod şi apoi vizitarea imediată a nodurilor 
adiacente. 

e Căutare pe adâncime (depth-first search): se caută să se obțină maximum de 
adâncime prin vizitarea unui nod şi apoi efectuare de căutare recursivă pe 
adâncime pentru fiecare nod adiacent. 


9.5. PROBLEME DE ACOPERIRE PE REȚELE 


PODURILE DIN KONIGSBERG 


Königsberg, oraş din Prusia orientală (astăzi cunoscut sub numele de 
Kaliningrad în Rusia), este aşezat pe râul Pregel care înconjoară insula Kneiphof, 
după care se desparte în două braţe. Apa delimitează terenul în patru zone distincte. 
Malurile râului şi insula sunt legate prin şapte poduri. 


ISP \\ 
Coru > 


© 
Fig. 91 Harta podurilor din Königsberg 


La începutul secolului 18, orăşenii şi-au pus întrebarea: „Este posibil sa 
facem o plimbare prin oraş trecând pe fiecare din cele şapte poduri o singură dată şi 
să ne în toarcem de unde am plecat?” Matematicianul elveţian Leonhard Euler 
rezolvă problema în 1731, fapt care constituie actul de naştere al teoriei grafurilor. 


Logica ne spune că oricare punct din fiecare din cele patru zone este 
echivalent şi deci le putem trata unitar prin reducerea la unul singur (nodul). Podul 
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reprezintă calea de legătură (arcul). Problema poate fi deci reprezentată în mod 
abstract printr-un graf. 


A 


C 
Fig. 92 Reprezentarea sub forma de graf 


In conformitate cu teoria grafurilor problema se defineşte: Să se găsească un 
traseu acoperitor pe reţea care porneşte şi se încheie în acelaşi nod parcurgând toate 
arcele exact o singură dată. 


Acea cale care acoperă graful, pornind dintr-un nod şi încheindu-se în acelaşi 
nod şi traversează fiecare arc exact o singură dată se numeşte parcurs eulerian. Graful 
care conţine un parcurs Eulerian poartă numele de graf Eulerian. 


Teorema lui Euler — un graf G este Eulerian dacă si numai dacă toate 
nodurile au grad par. 


Fleury's Algorithm 


Fie G = (N ; A) un graf conectat. Dacă G este Eulerian atunci următorul 
algoritm va produce un traseu Eulerian pe G. 


Pas 1. Alege oricare nod v din G şi fixează-l drept nod 
curent şi inițializează traseul cu o secvența de arce 
vidă. 

Pas 2. Selectează oricare arc a incident din nodul 
curent, dar nu se alege o punte decât dacă nu există 
alternative. 

Pas 3. Adaugă a la secvenţa de arce care constituie 
calea şi stabileşte celălalt capăt al arcului a ca nod 
curent. 

Pas 4. Elimină a din graf. Elimină toate nodurile 
izolate. 
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Pas 5. Dacă G este vid atunci STOP. Altfel trece la 
Pas 2. 


PROBLEMA POŞTAŞULUI CHINEZ 


Problema poştaşului chinez este legată de eficienţa deplasării unui poştaş 
pentru livrarea corespondenței într-un mediu urban. El trebuie să străbată cel putin o 
dată toate străzile pornind dintr-un nod, unde se presupune că se află oficiul poştal, şi 
să se întoarcă în punctul de pornire. Distanţa total parcursă trebuie să fie minimă. 


Problema a fost prima dată studiată de matematicianul chinez Meigo Guan în 
anul 1962, de unde provine şi numele. 


Din punctul de vedere al teoriei grafurilor problema are formularea: 


Să se găsească un circuit care traversează fiecare arc a unui graf G = (N ; A) 
cel putin o data si pentru care suma costurilor este minima. 


Găsirea soluţiei optimale într-un graf orientat sau neorientat este 
NP-completă. 


Chiar dacă a intrat în istoria teoriei grafurilor sub denumirea de „problema 
postasului” o aplicație esențial este şi aceea a inspecției drumurilor dintr-o rețea 
(presupunem că pentru determinarea stării tehnice). De aceea problema mai poate fi 
întâlnită în literatură şi sub denumirea de problema inspecției drumului (engl. route 
inspection problem). 


CICLU HAMILTONIAN 
Considerând un graf neorientat G = (N, 4) să se găsească un traseu care 
vizitează fiecare nod exact o singură dată şi se întoarce în nodul de pornire. 


Dacă un asemenea traseu există un asemenea traseu atunci graful se numeşte 
graf Hamiltonian iar traseul ciclu Hamiltonian. 


Deşi par să existe similarități cu graful Eulerian există mari diferențe. 


Intuitiv s-ar spune că este cu atât mai probabil ca un graf să fie Hamiltonian 
cu cât există mai multe arce. Dirac, în 1952, a demonstrat teorema care îi poartă 
numele: 


Oricare graf nu un număr de noduri n > 3 şi gradul minim al nodurilor cel 
putin egal cu n/2 are un ciclu hamiltonian. 


Utilizând această teoremă putem afla dacă avem sau nu un graf Hamiltonian. 
Aflarea efectivă a circuitului este însă ceva mai dificilă pentru că nu există algoritmi 
care să rezolve problema într-un timp rezonabil. 
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Problema este NP-completă. 


PROBLEMA VÂNZĂTORULUI AMBULANT 


Există multe aplicaţii care au legătură cu ciclul Hamiltonian. Între acestea 
este problema vânzătorului ambulant. 


Această problemă are forma: pe o reţea în care nodurile reprezintă oraşele, un 
vânzător trebuie să viziteze toate oraşele cel puţin o dată cu costuri minime, cunoscut 
fiind costul călătoriei pe fiecare latură a rețelei. 


Problema se simplifică dacă graful considerat este Hamiltonian. Vânzătorul 
va trece prin fiecare nod exact o singură dată. In acest caz algoritmul poate fi 
constituit din următorii paşi: 


Pas 1. Listează toate ciclurile Hamiltoniene. 
Pas 2. Calculează costurile pentru fiecare ciclu 
Pas 3. Alege ciclul cu costul cel mai mic. 


Trebuie notat că pot exista mai multe cicluri cu acelaşi cost. 


Această formă a problemei are cea mai bună soluţie de complexitate 
exponențială. 


Este o problemă de optimizare discretă sau combinatorică şi un exemplu 
arhicunoscut de ilustrare a clasei de probleme din teoria complexității computationale 
greu de rezolvat. Dacă nu există un ciclu Hamiltonian problema este de complexitate 
factorială (n/). 
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PROBLEME DE MINIM 
ȘI MAXIM PE REŢEA 


10.1. INTRODUCERE 


Să considerăm un graf orientat simplu G = (N „4) în care N este mulțimea 


nodurilor şi A este mulţimea arcelor unde W are dimensiunea n şi A are dimensiunea 
m. Fie c: A— R o funcţie care ataşează un cost c; fiecărui arc (i, j)e A. Date fiind 


două noduri speciale o şi d numite origine şi destinaţie să se găsească o cale între o şi 
d în aşa fel încât costul total (suma costurilor arcelor incluse) să fie minim. 


Corolarul acestei probleme este să se găsească drumul cel mai lung între 
origine şi destinaţie. Se mai numeşte şi „problema drumului critic”. 


Pe lângă calea cea mai scurtă şi cea mai lungă este de multe ori necesar să se 
listeze în ordine cele mai scurte sau cele mai lungi k drumuri între origine şi 
destinație. 


Toate aceste probleme au numeroase aplicaţii în industria transporturilor şi în 
administrarea infrastructurii transporturilor. Majoritatea programelor de optimizare 
din acest domeniu utilizează algoritmi de aflare a drumului (drumurilor) minim 
(minime). 


În continuare vom prezenta metode de găsire a căii minime între origine şi 
destinaţie şi problema primelor k drumuri minime între origine şi destinație insistând 
asupra celei de-a doua deoarece este mai generală şi cu aplicaţii multiple în 
transporturi, managementul infrastructurii, logostică etc. 
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10.2. DRUMUL CEL MAI SCURT 

Aflarea drumului cel mai scurt este o problemă studiată extensiv în anii 1950. 
Este o problemă relativ uşoară pentru o reţea cu n noduri şi m arce rezolvarea poate fi 
aflată cu un algoritm de complexitate O(n”). Chiar dacă această complexitate a fost 
demonstrată şi implementată în numeroase programe practice, totuşi se mai lucrează 
la îmbunătăţirea şi simplificare algoritmului. 


Diferite îmbunătăţiri au fost aduse şi complexitatea este prezentată în tabelul 
următor. 


Tabelul 9. Evoluţia complexității algoritmilor de aflare a drumului minim 


Algoritm Complexitate 
Dijkstra — 1959 O(n”) 
Williams — 1964 O(m log, n) 
Johnson — 1977 O(m log, n), d = max(2, 25 
n 
Boas et al. — 1977 O(c + m log, clog, log, c) 
Johnson — 1982 O(mlog, log, c) 
Fredman&Tarjan — 1981 O(m + n log, n) 
Gabow — 1985 O(mlog, c),d = max(2,~) 
n 
Tarjan et al. — 1989 O(m + n,/log, c) 


Această problemă are câteva abordări standard: 


Sursă unică — destinaţie unică: considerând o origine trebuie să se găsească 
drumul cel mai scurt până la un nod numit destinaţie; 


Sursă unică — toate destinațiile: considerând un nod de origine trebuie găsite 
drumurile cele mai scurte către toate celelalte noduri din reţea. 


Toate perechile: trebuie găsite drumurile minimale între toate perechile de 
noduri. Această problemă poate fi văzută şi ca n probleme de sursă unică şi rezolvată 
ca atare. 


Problema căii minime este una dintre cele mai studiate probleme în 
cercetările operaţionale privind optimizarea traficului în reţele. În domeniul 
transporturilor şi al administrării infrastructurii transporturilor se utilizează atât 
problema simplificată a determinării drumului minim (din punctul de vedere al 
distanţei, timpului, costului etc.) între o origine şi o destinaţie dar şi alte variante de 
acțiune sub anumite restricții suplimentare sau structuri de graf particulare. 
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Datorită naturii aplicaţiilor, în alegerea algoritmilor specifici specialistul în 
ingineria transporturilor trebuie să aibă o abordare flexibilă atât din punctul de vedere 
al timpului de rulare cât şi din punctul de vedere al memoriei utilizate. Deoarece nu 
există un algoritm pe care putem să-l considerăm cel mai bun, alegerea se va baza pe 
rezolvarea condiţiilor considerate. Datorită dimensiunii deosebite a problemei, o 
atenţie deosebită trebuie alocată alegerii şi implementării unor structuri de date 
eficiente (Tarjan et al. 1983 [175]). 


ABORDĂRI ALE PROBLEMEI DRUMULUI CEL MAI SCURT ÎN CĂI DE 
COMUNICAȚIE . 


Analiza st planificarea transporturilor au utilizat in permanenta proceduri de 
calcul al drumului cel mai scurt. Modeland retele de mari dimensiuni, cu multe 
condiții şi având permanent nevoie de a compara variante multiple, specialiştii în 
cercetări operaţionale au avut nevoie de algoritmii cu permanente mereu îmbunătăţite. 
Performanţele mai bune au condus la modele mai bune care la rândul lor au necesitat 
inventarea de ca mai A 


[165]). Numărul real al de digi cu siguranță mult mai mare. Ei E a aceste 

lucrări atât in publicaţii din domeniul teoriei grafurilor cât şi în reviste de alte 
specializări: transporturi, calculatoare, telecomunicaţii, management, cercetărilor 
operaţionale etc. Aceasta denotă interesul deosebit acordat problemei şi importanța ca 

soluţia să fie una eficientă din punctul de vedere al costurilor. De aceea există 
numeroase variante de algoritmi, unele fiind îmbunătățiri ale variantelor- anterioare, ee 
numeroşi fiind autorii care şi-au adus contribuţie. Pentru treceri întrevistă asupra ia 
subiectului a se vedea: (Johnson 1973(a)- 163], Denardo şi Fox 1979 452], [153], 

Shier si Witzgall 1981 [171], Deo si Pang 1984 [154], Gallo si Pallottino 1986 [161], 
Bertsekas 1991b [149], Ahuja, Magnanti si Orlin 1993 [144], Cherkassky, Goldberg 

şi Radzik 1996 [151]. 


Majoritatea sistemelor software utilizate în planificarea transporturilor posedă 
module de calcul a căii minime. Un interes deosebit se manifestă şi în domeniul 
planificării lucrărilor de construcţie unde distanțele până la sursele de aprovizionare şi 
costurile asociate sunt elemente critice. Pentru treceri în revistă asupra algoritmilor 
căii minime în transporturi a se vedea: Steenbrink 1974 [174], Van Vliet 1978 [176], 
Gallo şi Pallottino 1984 [159], Pallottino şi Scutellă 1997 [165]. 


ALGORITMUL LUI DIJKSTRA 


Acest algoritm a primit numele inventatorului său, olandezul Edsger Dijkstra. 
Rezolvă problema drumului minim pentru un graf G(N, 4) conectat şi orientat a 


cărui costuri pe arce sunt ne-negative. Primeşte ca date de intrare un graf G cu costuri 


163 


Capitolul 10 — Probleme de minim şi maxim pe reţea 


ne-negative şi un nod de pornire — originea. Algoritmul are o abordare egoistă. La 
fiecare iteratie se caută nodul cel mai apropiat de origine. 


Ideea care stă la baza algoritmului este faptul că orice drum minimal este 
alcătuit din segmente care la rândul lor sunt minimale. 


Presupunem că funcția c:N xN —[0,00] descrie costurile c(u,v) de 
deplasare de la nodul u la nodul v pe arcul corespunzător — pentru nodurile neconetate 
presupunem că distanţa este infinit. Costul drumului dintre două noduri este suma 
arcelor ce constituie drumul. 


Algoritmul Dijkstra funcționează prin construirea unui sub-graf S al lui G în 
aşa fel încât distanța de la origine la orice alt nod este minimă. Initial S conţine doar 
originea cu distanța 0. 


La fiecare iteratie se identifică nodul a cărui distanță până la origine este 
minimă şi se adaugă la arbore. Algoritmul se încheie când S devine un arbore de 
acoperire pe G sau când toate nodurile de interes au fost atinse. 


Algoritmul Dijkstra 


Initializeaza: S - {s}; d[s] =- 0; 
Initializeaza: d(v) =- c(s,v) pnrtu veN(G)-sS 


Cât timp |SIZINI 
Alege u din N-S încât d(u) este minim 
S- SU {u} 
Pentru fiecare nod v e N-S caculează 
d(v) = min( d(v), d(u)t+c(u,v) ) 


Fig. 93 Algoritmul conceptual Dijkstra 


Fig. 94 Graful pentru tratare cu algoritmul lui Dijkstra 
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S u d[B] d[C] d[D] d[E] 
0 {A} - 7 00 00 1 
1 {A,E} E 6 6 3 1 
2 {A,E,D} D 6 4 3 1 
3 {A,E,D,C} C 5 4 3 1 
4 {A,B,C,D,E} B 5 4 3 1 


Fig. 95 Exemplu de rezolvare cu algoritmul lui Dijkstra 


Algoritmul lui Dijkstra este de tipul stabilirea etichetei deoarece, de fiecare 
dată când un nou nod este ales să facă parte din S, distanța din origine şi traseul fixat 
sunt definitive. 


Acest algoritm are complexitatea de rulare O(n”). 


ALGORITMUL BELLMAN-FORD 

Fie C,(7) lungimea celei mai scurte căi nodul 7 şi destinație (nodul n) care 
este alcătuit din cel mult ¢ arce. Considerăm C,(7) = 0 pentru oricare ¢ şi C,(0) = 
pentru toate iz n. Atunci 


C+D = min (Cy + Cai = Imn i (7) 


Aceasta formulare defineste algoritmul Bellman-Ford. 


Se ataşează fiecărui nod indicatorii z şi d. De tip pointer, z este o locaţie in 
care se stochează referința către nodul anterior din calea cea mai scurtă, iar d 
păstrează distanţa pe calea selectată. În fiecare iteratie pentru fiecare nod se testează 
toate arcele şi în cazul în care noua cale obţinută are o lungime mai mică decât cea 
reținută deja atunci noua cale se reține, corectând rezultatul. Algoritmul este deci de 
tipul corectia etichetei: z şi d pot fi considerate împreună ca fiind o etichetă. 


Algoritmul Bellman-Ford 
Initializeaza: d - œ, d(s) <- 0, m e- nil 


Pentru m « 1 la |N|-1 Repeta 
Pentru (u,v)eA ( adiacente din u ) 
Dacă d[v]>d[u]+c (u,v) Atunci 
meu, dlv] < d[u]+c (u,v) 


Fig. 96 Algoritmul conceptual Bellman-Ford 
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Acest algoritm se pretează la programare dinamică. 
Considerând că cea mai scurtă cale dintre origine şi nodul v are m arce şi 


constă dintr-o cale între origine şi un nod u care are m-l arce, atunci: 


7, (Vv) = min z,,_,(u)+c(u,v) (8) 


(uv) 


Din structura sa foarte simplă se poate observa că algoritmul Bellman-Ford 
are complexitate O(mn) . 


Fig. 97 Exemplu de graf pentru rezolvare cu algoritmul Bellman-Ford 


A B C D E 
0 0 00 00 00 00 
1 0 T(A) 00 00 1(A) 
2 0 6(E) 6(E) 3(E) 1(A) 
3 0 6(E) 4(D) 3(E) 1(A) 
4 0 5(E) 4(D) 3(E) 1(A) 


Fig. 98 Exemplu de rezolvare cu algoritmul Bellman-Ford 


10.3. CELE MAI SCURTE K DRUMURI PE GRAF 


INTRODUCERE 


După cum am văzut în partea anterioară problema căii minime se reduce la a 
găsi acel drum între o origine şi o destinaţie care are cel mai scăzut cost. Cost are un 
înțeles larg putând fi: distanță, greutate, valoare monetară, consum de combustibil, 
sau chiar o variabilă agregată ce înglobează diferite dezavantaje ale unei anumite căi. 
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In multe situaţii calea minimă singură nu descrie complet situația. Este 
necesar să se determine şi următoarele căi care unesc originea şi destinația 
(următoarele în sensul ordonării costurilor aşa cum au fost ele considerate). 


Problema se poate defini deci astfel: din mulțimea căilor care leagă originea 
şi destinația să se determine primele k în ordinea crescătoare a costurilor. 


Necesitatea includerii în cercetările operaţionale rezidă în faptul că, de 
exemplu, şoferii nu aleg obligatoriu calea cea mai scurtă din reţea. Fiind o decizie 
psihologică, criteriile fiind adesea subiective, alegerea se conformează legilor 
psihologiei şi are mai degrabă o distribuţie statistică. Combinarea cunoştinţelor despre 
distribuţia opţiunilor cu calculul unui număr de căi, în ordinea lor firească, poate 
conduce la înţelegerea comportării microscopice şi macroscopice a traficului. 
Rezultatul cel mai spectaculos putând fi alocarea dinamică a traficului, un subiect de 
mare actualitate în zonele cu trafic aglomerat. 


Modificările ce apar în trafic prin dirijarea intenționată sau prin informații în 
timp real ce parvin participanților conduc subsecvent la modificarea costurilor ataşate 
anumitor sectoare din reţea. Prin aceasta toate căile dintre două noduri oarecare din 
rețea vor avea condiții diferite şi implicit ordinea în care ele sunt cotate se va 
modifica. Prin aceasta se modifică dinamic şi preferinţele. 


Este imperios necesar să se dezvolte algoritmi de calcul a primelor & drumuri 
scurte între origine şi destinaţie. Aplicațiile lor sunt numeroase în domeniul 
infrastructurii transporturilor, comunicaţii, logistică etc. 


În esență, problema celor mai scurte k drumuri este o generalizare a 
problemei căii minime. Dacă pentru drumul cel mai scurt găseşte doar o cale între 
origine şi destinație, problema aceasta găseşte primele k drumuri ordonate crescător 
după un criteriu numit generic distanță. Nu este aşa de simplu de rezolvat ca problema 
drumului minim dar are o arie mai largă de aplicaţii. 


În managementul transporturilor calculul căilor cele mai scurte este o 
prezență constantă. Dacă din motive diverse (lucrări, congestii de trafic, activităţi 
sportive etc.) cea mai scurtă cale nu este disponibilă, este de dorit să dispunem de 
variante suplimentare. De asemenea, planificarea urbană trebuie să modeleze mult 
mai aproape de realitate fluxul vehiculelor pe variante alternative decât pe cale unică. 
Este cunoscut că participanții la trafic aleg între variante cu o anumită probabilitate. 


Pollack [167] a formulat problema generală după cum urmează: 


Se dă un set de noduri fiecare pereche fiind conectată printr-o conexiune. Se 
dau distanţele dintre noduri fără să fie obligatoriu simetrice (distanța de la nodul 7 la 
nodul j nu este obligatoriu aceeaşi ca distanţa de la j la i). Toate distanțele se 
consideră nenegative, dacă nu există conexiune directă distanţa este infinit. Distanţa 
dintre oricare pereche de noduri nu este obligatoriu o distanţă fizică (poate fi cost, 
timp, întârziere etc.). Calea k dintre nodurile i şi j este definită ca fiind al k-ulea 
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a i ma ita ii, g 


Modalitatea clasică este de a găsi toate căile dintre origine şi destinaţie, de a 
le sorta şi de a alege primele k. Metoda găseşte întotdeauna rezultatul corect dar este 
foarte laborioasă. Poate fi utilizată doar pentru rețele foarte mici. Toate celelalte 


metode găsesc cea mai bună soluţie doar cu o anumită probabilitate. Eficienţa fiecărei 
metode depinde de topologia reţelei. 


DIFERITE METODE DE TRATARE 


Polack [167] şi Shier [172], [173] trec în revistă metodele de algoritmi 
dezvoltați pentru rezolvarea problemei primelor k drumuri. In continuare vom 
enumera câteva exemple. 


Bock, Kanter; and Haynes [150] descriu o metodă de determinare a primelor 
k drumuri utilizând „tulpini” şi arbori. Metoda listează sistematic toate căile dintre 
origine şi destinaţie. După ce toate căile au fost găsite, ele se ordonează. Metoda nu 
poate fi folosită decât pentru reţele reduse ca dimensiune dar în acest caz este cea mai 
bună metodă. 


Metoda drumului cel mai scurt 


O metodă simplă pentru valori mici ale lui k porneşte de la aflarea celei mai 
scurte cai. Ideea este că orice drum scurt din listă este o deviere de la o cale mai 
scurtă [168]. Pentru fiecare nivel al lui k trebuie complet rezolvat nivelul anterior. De 
fiecare dată se consideră pe rând căile deja incluse în listă şi se elimină câte un arc 
după care se calculează calea minimală în graful rezultat. Se pretează doar la reţele 
restrânse şi valori mici ale lui k. 


Fig. 99 Exemplificare a metodei drumului cel mai scurt 
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Metoda lui Bellman şi Kalaba 


Bellman şi Kalaba [147] prezintă o metodă care încearcă să determine 
primele k drumuri de la toate nodurile către un nod dat. Algoritmul a fost evidențiat şi 
perfecționat de Pollack [167]. 


Prin această metodă se evaluează consecutiv calea cea mai scurtă, a doua 
cale, a treia şi aşa mai departe. Pentru fiecare valoare k nivelul anterior trebuie să fie 
rezolvat. In principiu, trebuie să se rezolve ecuațiile: 


u, = min(r, +u), unde i=1,2,...,n-1, 
jzi 


ALGORITMI CU CORECTIA ETICHETEI (LABEL-CORRECTING) 


Petru fiecare nod se poate ataşa o „etichetă” constând într-un vector în care se 
păstrează fiecare din primele 7 căi şi lungimea lor. Filozofia algoritmilor cu corectia 
etichetei (există o întreagă familie) constă în modificarea continuă a etichetei ataşate 
nodurilor până când, în final, se poate spune că valoarea ataşată este corectă [173]. 
Valorile de lucru ataşate sunt temporare. 


Aceşti algoritmi dau primele k drumuri între un nod de origine şi toate 
celelalte noduri din reţea. algoritmul tipic este format din 3 paşi. 


LCI. Se porneşte cu o aproximaţie inițială a lungimii căii k de la nodul 1 la 
fiecare nod j. Aceasta înseamnă atribuirea unui vector x(j)=(Xj1, Xj2,-.-.Xjx) de fiecărui 
recomandă ca fiind convenabile: 

x(1)=(0,2,...,00) 
X(j)=(00,0,...,00) pentru j=2..n 


LC2. Se alege un nou arc i şi se procesează arcul. Prin procesarea arcului 
(i,j) se înțelege faptul că se încearcă să se îmbunătățească vectorul x(j) prin 
verificarea căilor de la până la nodul i cuprinse în vectorul i la care se adaugă arcul 
(i,j). Dacă oricare dintre valorile {Xjmt+aj:m=1...k} conduc la un drum mai scurt 
decât oricare dintre cele cuprinse în x(j), atunci vectorul x(j) este actualizat prin 
includerea căii mai scurte. Se subintelege că se realizează toate actualizarile posibile 
ale vectorului x(j) utilizând x(i) când se procesează arcul (i,j). 


LC3. STOP dacă se face verificarea criteriilor de încheiere. Altfel întoarcere 
la pasul LC2. 


Avantajele unei astfel de metode sunt: oferă soluţii exacte şi rămân valide 
chiar şi în cazul costurilor negative. Sigura cerință este să nu existe circuite negative. 
Mai jos sunt prezentate patru tipuri de algoritmi cu corectia etichetei: 
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Forma de bază a algoritmului cu corectia etichetei 


În această metodă arcele sunt prelucrate într-o ordine fixă. Arcele adiacente 
nodului notat cu 1 sunt prelucrate mai întâi, apoi cele adiacente nodului 2 etc. 


Daca se întâlneşte un nod cu etichetă (0,00,...,00) arcele corespunzătoare nu 
vor fi procesate. 


Dacă într-o iteratie nu se face nici o actualizare atunci algoritmul se opreşte. 


Pasi: Pune x(1)<-(0,~%,...,00), x(j)<-(00,0,...,00) pentru jzl. Atribuie 
NOD=1. 


Pas2: Dacă x(nod)<(,0,...,00) atunci mergi la pas3, altfel examinează 
NOD: pentru fiecare j adiacent fata de NOD procesează arcul (NOD,)). 


Pas3: Daca NODX<N atunci NOD<-NOD+1 şi treci la Pas2. 


Pas4: Dacă s-au făcut modificări asupra unei etichete x(j) atunci NOD—1 si 
treci la Pas2. Altfel STOP. 


Algoritm cu indicator de modificare (alteration flag — AF) 


Este o variantă a algoritmului de bază. Ideea este ca într-o iteratie să nu se 
examineze un nod dacă vectorul celor k-drumuri asociat nu s-a modificat de la 
examinarea anterioară. Acest algoritm asociază pentru fiecare nod un indicator 7 ( j) 


cu proprietatea că T (j)=0 dacă nu au avut loc schimbări, 7 ( j=l a apărut o 
schimbare. 

Pas1: x(1)=(0,%,...,0), x()=(00,0,....0) pentru j#1; T(1)=1, TQ)=0 pentru 
j#1. Stabileşte NOD=1 

Pas2: Dacă T(NOD)=0 atunci treci la PAS3. Altfel, începe examinarea lui 


NOD: pentru toate nodurile j adiacente lui NOD, procesează arcul (NOD, j). Daca 
există o modificare la eticheta nodului j atunci T(j)=1. T(NOD)=0. 


Pas3: Dacă NOD<N atunci NOD<-NOD+1 şi trece la PAS2. Altfel, 
verifică dacă în PAS2 a fost modificat un vector x(j). Dacă au fost făcute modificări 
NOD=1 trece la PAS2. Altfel STOP 


Algoritmul cu listă de secvențe (sequence list — SL) 


Nodurile nu mai sunt examinate într-o ordine fixă. Se generează o listă de 
noduri şi de fiecare dată se examinează următorul din listă. 


Când este examinat un nod, toate arcele adiacente din acel nod sunt procesate 
şi acel nod este eliminat din listă. Lista este de tipul FIFO. Când un arc (i,j) este 
procesat şi rezultă o modificare a etichetei nodului j acesta este adăugat în listă, dacă 
nu este deja. 
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In principiu algoritmul are următoarea forma: 


PASI: x(1)=(0,%,...,00), x(j)=(00,0,...,00) pentru j#1, adaugă nodul 1 în 
listă. 

PAS2: Extrage nodul i din capul listei. Examinează nodul i: pentru toate 
nodurile j adiacente dinspre i procesează nodul (i,j). Dacă nu este deja în listă adaugă 
j în coada listei. 


PAS3: Dacă mai există noduri în listă trece la PAS2. altfel STOP. 


Algoritmul cu dublă baleiere (double-sweep — DS) 


Metoda reprezintă o altă versiune a algoritmului de bază. În loc să se 
examineze nodurile în aceeaşi ordine 1,2,...,n în fiecare iteratie, această metodă face 
două treceri alternante înainte şi înapoi. Într-o primă fază se consideră nodurile j în 
ordinea 1,2,...,n şi se examinează arcele (j,i) pentru i<j. În faza a doua se consideră 
nodurile j în ordinea n,...,2,1 şi se examinează nodurile (j,i) pentru j>i. Procesul 
continuă până când nu mai există alte iterații posibile. 


PASI: x(1)=(0,20,...,0%0), x(j)=(,0,...,00) pentru j#1. 
PAS2: Consideră NOD=2,...,N. Pentru nodurile i, i<NOD, care sunt 
adiacente cu NOD, procesează arcul (NOD,) 


PAS3: Dacă nici o eticheta x(j) nu s-a modificat în timpul PAS2 atunci 
STOP. 


PAS4: Consideră NOD=N-1,...,1. Pentru nodurile i, i>NOD, care sunt 
adiacente cu NOD, procesează arcul (NOD,). 


PAS5: Dacă nici o eticheta x(j) nu s-a modificat în timpul PAS4 atunci 
STOP. Altfel trece la PAS2. 


ALGORITMUL CU FIXAREA ETICHETEI (LABEL-SETTING — LS) 


Acest tip de algoritm este adecvat calculării primelor k drumuri pentru rețele 
cu arce cu lungimi ne-negative. Prin contrast cu algoritmii cu corectia etichetei, 
algoritmul cu fixarea etichetei identifică în fiecare pas o valoare corectă şi 
permanentă pentru un nod. 


PASI: x(1)=(0,~,...,©), x(J)=(00,0,...,c0) pentru j#1. adaugă toate nodurile 
în listă (toate componentele sunt făcute temporare) şi atribuie i=1 
PAS2: Găseşte cel mai mic component temporar TEMP pentru nodul i. 


Pentru fiecare nod j adiacent dinspre i adaugă, dacă este posibil, valoarea 
TEMP+A(i,j), în vectorul x(j). 


PAS3: Defineşte ca permanentă componenta TEMP a nodului i. Înlătură 
nodul i din listă dacă nu mai sunt componente temporare pentru acest nod. 


171 


Capitolul 10 — Probleme de minim şi maxim pe reţea 


PAS4: Dacă lista este goală atunci STOP. Altfel, găseşte un nod i a cărui 


cea mai mică componentă este minimă pentru toate nodurile din listă şi trece la PAS2. 
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ELEMENTE DE TEORIA COZILOR 


11.1. INTRODUCERE 


Cozile de aşteptare, numite si „fire de aşteptare” de unii autori de limba 


magazin fie că suntem în maşină la un semafor, ne supunem aceloraşi legi ale cozilor. 


Scopul studierii cozilor de aşteptare este de a stabili structura sistemului, a 
determina parametrii funcționali (timpul mediu de aşteptare în sistem, media lungimii 
cozii, utilizarea punctelor de deservire) şi de a identifica măsurile adecvate de 
optimizare. 


Teoria matematică utilizată în studiul cozilor este o aplicaţie a teoriei 
probabilităților şi se întâlneşte sub diferite denumiri: teoria traficului, teoria cozilor, 
teoria congestiei, teoria servirii de masă, teoria sistemelor stocastice de deservire etc. 
(Cooper-1981 [187]). Termenul de teoria traficului se aplică atât traficului de 
informaţii în telefonie şi telecomunicaţii cât şi traficului de vehicule. 


Uneori studiul teoriei cozilor se aplică în sisteme în care formarea acestora nu 
este permisă, ceea ce pare impropriu, dar tocmai acest tip de analiză specifică poate 
conduce la luarea deciziilor adecvate care să menţină sistemul funcțional. 


Structura generală a unei cozi de aşteptare este reprezentată în figura 
următoare: 
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Linia de aşteptare 


Sosire coada . Ieşire 
ml —— Servire i 
À - rata sosirilor. Disciplina de 


servire 


E A. T, - timpul de servire 
Lc — elemente în aşteptar 


ean u - rata de servire 
Tc — timp în aşteptare 


L — elemente reținute în sistem 
T — timp de reţinere 


Fig. 100 Structura unei sistem cu coadă de aşteptare 


Istoric vorbind, subiectul a fost analizat şi dezvoltat din punct de vedere 
matematic în contextul ingineriei traficului telefonic. În prezent este aplicat pe larg în 
rețele de calculatoare, cercetări operaționale, inginerie civilă etc. De remarcat ca 
tehnicile matematice de analiză sunt similare cu cele utilizate în domenii ce nu par a fi 
înrudite precum inventarul stocurilor de producţie, studiul amenajărilor hidrotehnice, 
asigurări etc. 


NOTAȚIA KENDALL 


Aşa-numita notație Kendall este o schemă de caracterizare a cozii de 
aşteptare. Prin aceasta se descrie atât componenţa sistemului cât şi comportarea 
acestuia. 


Notatia Kendall presupune existenţa a şase parametri: 


distribuţia sosirilor; i 1 
distributia servirii; 

numărul de puncte de deservire; 

capacitatea maximă; 

populaţia totală; 

disciplina servirii. 


DAP 


Aceşti parametri sunt cuprinsi în formula: 


A/B/m/N/P-S (9) 


Primii trei parametri au fost trataţi de Kendall in 1953 [198], următorii au fost 
introdusi ulterior. 


Distributia sosirilor - A reprezinta legea statistica a intervalului de timp dupa 
care „clienţii” sosesc la coadă 


Distribuția servirii B reprezintă legea statistică a timpului de tratare a 
fiecăruia în cadrul punctului de deservire sau procesare. 
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m este numărul de puncte de deservire sau procesare care sunt caracterizate 
de distribuţia B. 


N numărul total de locuri în coadă inclusiv în punctele de deservire. Dacă nu 
se specifică altfel se consideră infinit. 


P este populaţia totală sau maximul de entităţi care poate să se aşeze la 
coadă (ex. nu putem să ne aşteptăm să găsim la un semafor mai multe maşini decât s- 
au produs). Dacă nu se specifică explicit altfel acest parametru se consideră infinit. 


S - disciplina de deservire reprezintă ordinea în care entităţile din coadă sunt 
selectate din linia de aşteptare şi tratate. Acestea pot fi: FCFS — primul venit primul 
servit, LCFS — ultimul venit primul tratat; SPT — prioritate de servire funcţie de timp, 
unde selecţia se face pe baza timpului de tratare estimat (de exemplu la băcănie când 
cei care cumpără doar un singur articol sunt serviţi peste rând indiferent de momentul 
sosirii), SIRO servire în ordine aleatoare; prioritate statică — fiecărui tip de solicitare i 
se asociază o prioritate care nu se modifică în timp. În cadrul diferitelor nivele de 
prioritate disciplina poate fi FCFS, LCFS, SPT etc.; prioritate dinamică — prioritatea 
asociată poate să se modifice. 


Se pot utiliza şi alte tipuri de priorități considerate convenabil funcție de 
scopul urmărit. Dacă nu se indică altfel se implică o disciplină de tipul FCFS / FIFO. 


Pentru parametrii A şi B este comună utilizarea următoarelor notații: 


e M (Markov) — presupune o distribuție a intervalelor de sosire de tip 

“ sau a(t)=2e“ unde 4>0 este 
parametrul de formă. Avantajul unei astfel de distribuții în descrierea 
comportamentului cozii constă în faptul că este singura distribuţie continuă 
care este fără memorie (proprietatea Markov) adică intervalul şi 
probabilitatea sosirilor nu depinde de timpul scurs şi de istoricul sosirilor 
anterioare (proces Poisson). 

e D (Deterministic) — toate valorile sunt constante. Se presupune că sosirile au 
loc la intervale exacte de timp sau că servirea durează un timp fix. 

e E, (Erlang-r) — Distribuţia Erlang cu r faze. Constanta r este mai mare ca 


exponențial de forma A(t) =l-e 


zero. Forma generală a distribuţiei Erlang-r este: 


Fj 5 e) „4u>0 (10) 


e HI, (Hiper-k): Distribuţia hiper-exponentiala cu k faze. Forma generală este 


k 
F()= Salle); pp >osa 0: Xa, (11) 


i=l i=l 
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e G (General) — distribuţia nu este specificată. Poate avea oricare formă. Se 
cunoaşte doar media şi varianta. 

e GI (General cu timp independent între sosiri) — distribuția nu este specificată. 
Poate avea oricare formă. Se cunoaşte doar media şi varianta. 


PROCESUL POISSON 


Procesul Poisson este unul dintre cele mai importante modele 
comportamentale utilizate în teoria cozilor de aşteptare. 


Un proces Poisson este un proces care satisface următoarele condiții: 


e Numărul de modificări ale stării în intervale nesuprapuse sunt independente 
pentru toate intervalele. 
e Probabilitatea să existe exact o singură schimbare de stare într-un interval 
suficient de mic 7 zt este m, =vr, unde v este probabilitatea unei 
n 
schimbări şi n este numărul de încercări. 
e Probabilitatea ca într-un interval suficient de mic 7 să aibă loc două sau mai 
multe schimbări este 0. 


Dacă se consideră un timp suficient de îndelungat, pe intervale discrete, 
distribuţia care îndeplineşte aceste condiţii se numeşte distribuţia Poisson cu 


i ay _ eee ees 
probabilitatea P(N(t)=n)= l ) e™. Considerând distribuțiile pe un domeniu 
n! 
continuu, singura care îndeplineşte condițiile de mai sus este distribuția exponențială 
cu funcția distribuție a probabilității timpului dintre două  sosiri 
f(t)= P(N(t)=1)=e™. În plus acestea sunt şi distribuții fără memorie (proprietatea 
Markov). 


Proprietăţile unui proces Poisson sunt: 


e Superpozitia; 
e Selecţia aleatoare; 
e Despărțirea aleatoare. 


Aceste proprietăţi ale proceselor Poisson sunt importante în rationamentele 
utilizate în demonstrațiile legate de proprietăţile cozilor de aşteptare. 


Superpoziţia — Dacă se consideră două procese Poisson complet 
independente de parametru A, respectiv 4, atunci suprapunerea celor două procese 


va fi tot un proces Poisson cu parametru 2 = 4, +4. 


Superpozitia este prezentată în principiu in figura următoare: 
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AEL [eed ARE EI 


f d pey IL Ul 4 


Fig. 101 Superpozitia a două procese Poisson 


Selecţia aleatoare — dacă dintr-un proces Poisson de parametru A se face o 
selecție aleatoare în aşa fel încât pentru fiecare sosire probabilitatea de selecţie este 
z , independentă de celelalte, atunci procesul rezultat este tot un proces Poisson de 
parametru mÀ . 


Principiul selecţiei aleatoare este prezentat în figura următoare: 


cit ete. ee 


Fig. 102 Exemplu de selectie aleatoare 


Despărțirea aleatoare (random split) — dacă se considera un proces Poisson de 
parametru A şi se desparte în două subprocese cu probabilitățile z, si 7, astfel încât 
m, +m, =1 cele două procese rezultate sunt procese Poisson independente de 
parametru mÅ şi 74. 


Fig. 103 Despartire aleatoare 
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PROPRIETĂȚI ALE COZILOR DE AŞTEPTARE 


Rata de ocupare 
O caracteristică uzuală a cozii este utilizarea sau rata de ocupare. 


Rata de ocupare reprezintă proporția de timp cât există cereri sau clienţi în 
sistemul cu coadă de aşteptare. 


Pentru sisteme cu un singur operator de servire în care distribuţia sosirilor şi a 
servirii sunt indiferente, dar pentru care rata sosirilor este A şi media timpului de 
servire este EIB], proporţia de timp în care se procesează cererea (se efectuează 
servirea) este dată de AE [8]. Deoarece proporția nu poate să depăşească valoarea 1 
cerința de stabilitate este AE [B] <1. 


În general această valoare calculată se numeşte utilizare sau rată de ocupare şi 
se notează cu p. Pentru sistemele cu mai multe unităţi de servire (G/G/c) rata de 


ocupare este: 


<1 (12) 


Legea lui Little 


Această proprietate a fost intuită anterior dar a fost sistematizată şi 
demonstrată de Little în 1961 [202]. 


Considerăm un sistem în echilibru în care sosesc clienți, aşteaptă un interval 
de timp în sistem şi pleacă. Dacă notăm rata sosirilor cu 4, timpul mediu de aşteptare 
în sistem cu T şi numărul mediu de clienţi cu LZ atunci relaţia dintre cele trei este: 

L = AT (13) 


Demonstrația lui Little, era neintuitivă, destul de complicată şi necesita un 
aparat matematic dificil. Ulterior Stidham 1974 a reuşit să facă o demonstraţie simplă 
Şi riguroasă care impune doar ca / şi T să existe şi să fie finite. 


Sa 
L 
a 


( 
(i 
(¢ 


onsideram: 


t numărul de clienţi din sistem la momentul £; 


c 
) numărul de clienți care au sosit în intervalul [0, t|; 
b ) numărul de clienți care au plecat în intervalul [0, t|; 


T, timpul pe care clientul cu numărul 7 îl petrece în sistem. 
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Media L(t) până la momentul ¢ este: 


L= "| Lear (14) 


eo (15) 


1 a\t 
T, Sa (16) 


i=0 


a(t) 


t 
Reluând prima ecuație şi ținând seama de egalitatea f L(r)dt => 4 


0 
obtinem: 


L, = | (ear = 0 T, (17) 


Dacă acest calcul se face dupa un timp suficient de lung (t > ©) atunci 
L,oL,A FAST, >T. 


Deci pe termen lung: 


L=AT (18) 
Ceea ce era de demonstrat. 


Teorema lui Little este indispensabilă în analiza sistemelor cu coadă de 
aşteptare. 


Relaţia este valabilă şi între timpul mediu de aşteptare pentru a fi servit Tọ şi 


numărul mediu de elemente care aşteaptă să fie servite Lo. 


Proprietatea PASTA 


Cozile de aşteptare cu sosire de tip Poisson (M /e /e) poseda o proprietate 


specială: proporţia celor care sosesc şi găsesc sistemul într-o stare S este exact aceeaşi 
cu proporţia timpului cât sistemul este în starea S considerată. Proprietatea nu este 
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adevărată în general. Această proprietate se numeşte PASTA - Poisson Arrivals See 
Time Averages (sosirile Poisson sesizează timpul mediu) ([223], [224]). 


Proprietatea PASTA este un instrument puternic în analiza şi calculul 
caracteristicilor sistemelor cu coadă de aşteptare. 


11.2. ANALIZA COZILOR DE AŞTEPTARE 


Cozile pot fi stabile sau instabile. Sunt stabile acele sisteme în care procesul 
evoluează într-o manieră predictibilă. Dacă solicitarea este mai mică decât capacitatea 
de servire sistemul poate atinge echilibrul şi putem găsi prin calcul modele 
comportamentale. Dacă solicitarea este mai mare decât capacitatea atunci apar 
congestii, blocaje şi sistemul se comportă haotic. 


Analiza cozii de aşteptare presupune evaluarea caracteristicilor de sosire şi de 
ieşire şi stabilirea comportamentului sistemului în fiecare dintre stări sau cel putin 
calcularea timpului mediu de aşteptare în sistem, numărului mediu de elemente din 
sistem, timpului mediu de aşteptare pentru a fi servit şi numărul mediu de elemente 
care aşteaptă să fie servite. 


Avem deci patru variabile L, T, Lc, Te şi trei ecuaţii pe care le putem 
utiliza: 
1 


L=AT, Le = Mos T = Te +E|B]= Te +— (19) 
u 


Unde E[B] este timpul mediu de servire si u este rata de servire. 


Pentru a afla cele patru valori mai este necesară o ecuaţie. Cel mai adesea se 
utilizează: 


L= X (iz) (20) 


i=0 


Unde z, este probabilitatea ca în sistem să existe exact i clienți. 


L 


MODELE DE COZI DE AŞTEPTARE 


O coadă de aşteptare poate fi privită ca un proces de generare şi dispariție 
(birth-and-death process). Un model adecvat pentru o astfel de situație este lanțul 
Markov. 


Acest model constă în reprezentarea stărilor pe care le poate lua sistemul şi 
ataşarea probabilităților de tranziție între stări. O reprezentare generală printr-o 
diagramă a tranzitiilor este schitata în figura următoare. 
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À AN An 
S Sos 5092509 
Ra a 
Hn+1 
Fig. 104 Duid stărilor m un A cu coadă de aşteptare 


În diagramă numărul stării reprezintă numărul total de elemente aflate în 
sistemul cu coadă de aşteptare. Verificarea stabilității presupune existența unor ecuații 
de echilibru care să nu fie dependente de timp. Echilibrul este dinamic în sensul că 
Ta (t) - probabilitatea ca sistemul sa se afle in starea n este constanta. 


Dupa cum s-a considerat in aoe pentru starea n sistemul are doar trei 


1. sătreacă în starea n+1 cu o probabilitate 2, At; 
2. să treacă în starea n—1 cu o probabilitate Ar ; 
3. să rămână în starea n cu o probabilitate 1-— (4, + L, )At : 
Ecuația cu diferente care determină probabilitatea devine: 
Schimbând ce trebuie schimbat se obţine: 
dr,(t) _ 
dt 


Dacă n =0 se aplică formula: 


Talt Wia + Ta atha “An (2, + Hn) (22) 


drit 
O sale) due) (23) 
Sistemul de ecuații de mai sus se numește „ecuațiile Chapman-Kolmogorov”. 


DISTRIBUȚIA PROBABILITATILOR ÎN STARE STABILĂ 
Pentru ca sistemul să fie în echilibru (stare stabilă) este necesar ca z,(7)= 7, 


eu AH At Ky : 
constant, adica da) =0. Ecuațiile Chapman-Kolmogorov devin: 


Ta (2, t u) = Tain E Tnn (24) 


pentru n = 1,2,3,4,... $1 
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A97o = 447 (25) 
pentru n=0. 
Pornind de la ecuația (25) şi rearanjând convenabil ecuațiile (24) 
n = 1,2,3,4,... se obține: 
Fan = Anini (26) 
Din ecuaţiile (25) şi (26) se pot calcula probabilitățile z, . Astfel: 


A A A AA Ay 
m= Lms m= oA Tins mya ah i Es = Bohr Aa To (27) 
My MH, My Ms My A 
Evident 
yee! (28) 
Notând foha Aes cu Q, rezultă: 
Mill “HUn 


„150, ]-: (29) 


n=l 


Deci probabilitatea ca in sistem sa nu fie nici un client este data de: 
To= y|: + $o) (30) 
n=l 
Verificarea stabilităţii este dată de d „<0. 
11.3. COADA DE AŞTEPTARE (M/M/1) 


Sistemul de (M IMI 1) este caracterizat de o rată egală a sosirii şi a servirii 
indiferent de starea în care se află. 


AR A À 
H H H 


7 ig. 105 ENN tranzitiilor pentru (M/M/1) 
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Aplicând ecuaţiile (24) şi (25) rezultă: 
Ame = UT (31) 
şi o 
m, (A+ u)= Ta- Å +T al (32) 


Inlocuind corespunzător obținem: 


A 2 A 
Ti =— Tg, Ba =z To, Mz =—z Toss Ba =z Tos- (33) 
, : PRE „À z 
Din ecuația (29) şi ținând cont de faptul că — = p (ocuparea) rezultă: 
u 


E | j= n 
i-ai $ -|- mo Soo" zum! £ (34) 
nal H 


n=0 


Evident sistemul este stabil doar dacă p <1 caz în care 


LF > (35) 


şi deci 


m =1-p , 2,=p"(l-p) (36) 


Pentru calculul numărului mediu de elemente aflate în sistem (aflate în 
aşteptare şi în servire) vom face suma numărului de elemente din fiecare stare 
ponderate cu probabilitatea stării: 


- = = d, 
n=0 n=0 n=l P n=0 (37) 
pp te 
dp\\-p (I-p) 
ceea ce conduce la formula 
A 
L = 38 
(4-4) (38) 
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Fig. 106 Distribuția numărului mediu de cereri în sistem funcție de rata de 
ocupare 


Aplicând formula lui Little timpul mediu de aşteptare în sistem este: 


L A 1 


a Gian GD) ©) 


Timpul mediu petrecut în aşteptarea servirii este timpul mediu de aşteptare in 
sistem din care se scade timpul mediu de servire: 


ee cauti 1 _ A 46 
ea Gad) i Gan (40) 


De unde lungimea medie a cozii în aşteptarea servirii este: 


A z 
7 41 
(u-u (Au a 


11.4. COADA DE AŞTEPTARE (M/M/c) 


Sistemul de (M IMI c) este caracterizat prin prezenţa unui număr de posturi 
de servire identice. Rata sosirii este constantă indiferent de starea în care se află 


sistemul dar rata de servire variază. Principiul este prezentat în diagrama tranzitiilor 
din figura următoare. 
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À À À À À À 
ZN So i. pa N 
NY Pace SA Ra n” 

2 i Oe Ne eos = G = 
Fig. 107 Diagrama tranzitiilor pentru (M/M/c) 


Rata servirii este diferită deoarece pe măsură ce există mai multe cereri există 
şi posibilitatea de a le trata paralel până când toate posturile de servire sunt ocupate. 


— Servire 1 Ieşire | 


T, - timpul de servire 
p - rata de servire 


I l 1 Ieşire 2 

J 1 I Servire 2 > 
Linia de aşteptare 7 ~ T d iu 
coada) 


Sosire 


[Disciplina de] T, - timpul de servire 


À - rata sosirilor 


servire pi - rata de servire 
Lc — elemente in asteptaré 
Tc — timp în aşteptare 
Și Ieşire c 
en Servire c 


T, - timpul de servire 
|. - rata de servire 


Fig. 108 Structura unei sistem cu coadă de aşteptare (M/M/c) 
Conform (25) şi (26) relaţiile între probabilitati sunt: 


MA= TU , AM, = LUT, An, = UT p... AN = CUT, i 
AT, = CHUT os AN, | = CHUT E 


n 


Inlocuind iterativ corespunzător obținem: 


2 3 c 
T= A =i LA ae = To aes ee 2 , (43) 
3u 2\ uj 3u 3l u cl\ 


sau altfel spus: 
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T, =T "(alu pentru n =0,...,c (44) 
n! 
ŞI 
| n 
LALA a Alu) pentru n>c (45) 
ce 


Ecuatia (28) devine: 


Enon) A sta] 


nu e! U) INCH 


n=0 n=0 °"* 


ci n c 
=n (2 +4(4) cu 
ae 4 c! U cu-A 


Probabilitatea ca în sistem să nu fie nici un client este: 


-1 
PE n c 

Ty = bă l(a + lf a CH (47) 
n=0 n! H c! H CU — A 


Prezintă importanță in cazul (M/M/c) situaţia când toate posturile de 


(46) 


servire sunt ocupate şi un nou sosit trebuie să aştepte. 


ra = a (2) | : -zf4) "a (48) 


n=c 4 n=c CH c! u uM A 


Numărul de clienţi care aşteaptă să fie serviţi este 


AE San, sf (4) $ a ape (49) 


n=0 c! H n=0 CH 


COMPARATIE: UN SISTEM CU DOUĂ COZI (M/M/1) ŞI O COADĂ (M/M/2) 

Considerăm că avem două posturi de servire şi putem directiona sosirile în 
aşa fel încât să existe două sisteme identice şi separate cu cozi de aşteptare sau să 
existe un singur sistem cu o singură coadă dar cu două posturi de servire. 
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Linia de aşteptare 
À /2 = . lesire | 
TE >| Servire 1 
Disciplina de 
amr servire 
| Te e emente în aşteptare T, - timpul de servire 
Sosire c— timp în aşteptare u- rata de servire 
A - rata sosirilor 
Linia de aşteptare A lesire 2 
e 2 >| Servire 2 
pW) Disciplina de 
e servire 
Lc — elemente în aşteptare T <timeulide servite 
Te — timp în aşteptare E P P 
y - rata de servire 


Fig. 109 Structura sistemului cu două cozi (M/M/1) 


Servire 1 Ieşire | 


Linia de aşteptare 
coada) T, - timpul de servire 


p - rata de servire 


Sosire 


Disciplina de 
servire 


À - rata sosirilor 


e 


c — elemente în aşteptare 
Tc — timp în aşteptare 


= Servire 2 Ieşire 2 


T, - timpul de servire 
u - rata de servire 


Fig. 110 Sistemul cu o coadă (M/M/2) 


Pentru primul caz numărul mediu de clienţi care aşteaptă să fie serviţi în cele 
două cozi: 


A 2 
Leamimm = 2lc = 2 an ai ; a (50) 
u 


Pentru cazul cu şir de aşteptare unic şi două posturi de servire, conform (25) 
şi (26) relațiile între probabilitati sunt: 


TÅ = TU „AR, = LUT, , An, = LUT, Am, = LUT}... ATi = UT, (51) 


Inlocuind iterativ corespunzător obținem: 
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4 A Hig (2) 
T =T, T, =% =n = 7 : 
u 


auo yaw DAN 


2 3 
A I(A) a 11/42 

My =y = To = To > (52) 
2u 2\ u) 2u 22\u 


fo hj Min E et DAYAR Ei 
aau DON pr 2p Oahu) Oe Diy, 


Probabilitatea ca in sistem sa nu fie nici un client este: 


; -1 
eee eas E E (53) 
u uj 2u-àÀ 2u+A 
Probabilitatea ca un nou client să nu fie servit este : 
E a NI EE: ay 
z, =E A= £ (54) 
2u+A42\ uj) 2u- lu) 2u+Ă 
Numărul mediu de entități în aşteptare este: 
A a | 
Le (mim 12) = Zw 7 = (55) 
H-A \u) 2u+ 4 24-A 


Transformând corespunzător obținem: 


_ 2 1 Alu _ Alu 
Le um) = (A/u) Q A/a) Q = Al) = Lc (MM n) Q R Aju) (56) 


Dar A şi u sunt pozitivi şi pentru oricare valori 2, u 


A 
A ei (57) 
(2+ 4/4) 
Deci pentru oricare 1, „este adevărată formula: 
Leu) $ Le (mmn) (58) 


Pentru verificare prezentăm comparativ în tabelul următor numărul mediu de 
clienţi în aşteptare pentru diferite valori ale raportului 4/7. 
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Tabelul 10. Comparare lungimilor cozilor 


Alu Lo au/u /1) Leu /M /2) 
1.99999 399996.00 | 199997.50 
1.999 3996.00 1997.50 
1.9 36.10 17.59 

1.0 1.00 0.33 

0.9 0.74 0.23 

0.8 0.53 0.15 

0.7 0.38 0.10 

0.6 0.26 0.06 

0.5 0.17 0.03 

0.4 0.10 0.02 

0.3 0.05 0.01 

0.2 0.02 0.00 

0.1 0.01 0.00 


Concluzia ce se impune este ca sistemele care au doua posturi de servire ce 
lucrează simultan sunt mai eficiente daca sunt configurate cu un fir unic de aşteptare 
decât dacă lucrează cu două cozi independente. Acelaşi lucru este valabil şi pentru 
cazul general al existenţei mai multor posturi de servire (Vc >1). 


11.5. COZI DE AŞTEPTARE CU CAPACITATE FINITĂ 


Până acum am studiat sisteme de servire în care capacitatea şirului de 
aşteptare era infinită. Evident asemenea situaţie este greu de susținut în practică. În 
domeniul transporturilor, ca şi în majoritatea domeniilor, capacitatea constructivă a 
şirurilor de aşteptare este limitată. Solicitările de servire (clienţii) sosesc şi rămân în 
coada de aşteptare dacă există spațiu, altfel solicitările se pierd. Numărul total de 
locuri din sistem include numărul de posturi de servire. În continuare vom prezenta 
câteva tipuri de cozi de aşteptare cu capacitate finită începând cu cea mai simplă: 
(MIMI). 


SISTEME CU COZI DE AŞTEPTARE (M/M/1/1) 

Acest tip de serviciu cu coadă de aşteptare constă dintr-un singur post de 
servire cu timpul de servire ce urmează o distribuţie exponențială de rată 7 în care 
sosesc cereri de servire ce urmează o distribuţie o distribuție exponențială cu rata 2. 
Sistemul nu are locuri suplimentare de aşteptare. Cererile care sosesc în perioada cât 
o servire este în curs se pierd. 


Sistemul este foarte simplu de reprezentat: are doar două stări posibile, 
reprezentate în diagrama următoare: 
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À 
OSG 
Ser 
Fig. 111 Diagrama tranzitiilor pentru (M/M/1/1) 

În stare staționară 

MA = HT, (59) 
si 

m+ =l (60) 


Înlocuind obținem: 


u 
u+À 


(61) 


A A 
M+M—=1 > m| l+—|=1 > m= 
4 4 


şi 


ar a O 
°u pu+ãu wta 


= (62) 
Deoarece u si A sunt valori pozitive, indiferent de valoarea lor există o stare 
de echilibru. 


Notă: Interesant este aici de observat că dacă w şi A sunt egale 
probabilitatea ca să existe un client în servire este 1/2. Deci un asemenea serviciu 
porneşte din proiect cu 50% timp mort. 


SISTEME CU COZI DE AŞTEPTARE (M/M/1/N) 


Serviciul prezentat în secțiunea anterioară trebuie îmbunătăţit prin adăugarea 
de spaţiu de aşteptare. Se creează un număr suplimentar de n—1 locuri. Capacitatea 
totală a sistemului va fi n. Cererile de servire sosite rămân în coadă dacă este spațiu 
sau se pierd. Comportamentul sistemului este figurat în diagrama următoare: 
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090909 ui 0000 


Pa ig. 112 baia PARTI Pa A 


Aplicând ecuaţiile (25) şi (26) rezultă: 


Atty = uzi (63) 
Şi 
ie" hae 2) To (64) 
u u 


pentru 7 = 1,2,3,4,..., N 


jeogori o 


i=0 i=0 le (4/4) 


a A _ on ee E E 
Notând cu a:=—, dacă a +1, probabilitatea ca în sistem să nu fie nici o 


cerere de servire este: 


Nal (66) 


şi pentru 7 = 1,2,3,4,...,N 


wa (67) 


In cazul în care a =1, probabilitatea ca în sistem să nu fie nici o cerere este: 


1 
= 68 
° N+ (68) 
iar pentru i = 1,2,3,4,..., N 
I, = l (69) 
Na 
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Probabilitatea ca un client să fie respins este 77, . 


Numărul mediu de clienţi în sistem este dat de relaţia: 


N N i N+1 
pS imes mc). 8 A Hy „azi (70) 


şi 


yey = azi (71) 


Dacă toate cele N locuri din sistem sunt ocupate atunci solicitările 
suplimentare sunt respinse. Deci rata intrărilor care sunt reţinute în sistem este: 


A, = (l= ay )A = (1-1) (72) 


In consecinta, timpul mediu petrecut in sistem este: 


T=L/A, (73) 


CARACTERISTICI GENERALE (M/M/c/N) 


Acest tip de sistem este caracterizat prin sosiri care respectă o distribuţie 
exponențială de rată 4, un număr de c puncte de servire cu timp servire cu distribuție 
exponențială de rată yz şi o capacitate de N locuri în sistem inclusiv în punctele de 


servire. Comportamentul lor este figurat în diagrama următoare: 


00000000000 


Fig. 11 h a: ae reas moe de asteptare (M/M/c/N) 


Cand se atinge echilibrul, probabilitatile pentru fiecare stare sunt: 


T, =T) (2) pentru îi = 0,...,c (74) 


şi 
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1 (ay 
T; =o 2) pentru c<i <N (75) 
ele u 


Notand a := A/(cy), ecuația (28) devine: 


-1 N-c c-l e N-c 
| cay + “a (ca) ai = ml Stea) + (ca) a (76) 


Probabilitatea ca in sistem sa nu fie nici un client este: 


T = Shor „lea Sel (17) 


i=0 ”" i i=0 


N c N-c 
L = X (i-c); = an Sia 
j: i i=0 


5 zo(ca) a 1-(N-c+ a +(N-ch 
c! (l-a) 


(78) 


COZI DE AŞTEPTARE (M/M/c/c) 
Cozilor de tipul (M IM ic! c) se caracterizează prin existenţa unui număr de 


locuri în sistem egal cu numărul de posturi de servire (nu există locuri suplimentare). 
Niciodată un client acceptat nu va aştepta până să fie servit. O cerere intră direct în 
procesare sau nu este admisă de loc. Comportamentul acestui tip de sistem este 
figurat în diagrama următoare: 


Fig. 114 PE <a pentru cozile de aşteptare (M/M/c/c) 


Când se atinge echilibrul, probabilitățile pentru fiecare stare sunt: 


(aY 
T; = 779 (2) pentru i = 0,...,c (79) 
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Notând a := a ecuaţia (28) devine: 
u 


Cc 


= Vaz (80) 


a 
i=0 zo E 


Probabilitatea ca in sistem sa nu fie nici-un client este: 


To = Da (81) 


De interes este în acest caz probabilitatea ca cererile de servire să fie pierdute. 
Aceasta se întâmplă când toate cele c locaţiile sunt ocupate: 


ft a“ Je! 
Sarl (82) 


Aceasta este formula de pierdere a lui Erlang, dedusă de A.K. Erlang în 1917. 
Aceasta înseamnă că m, din solicitări vor şi pierdute. Este interesant de remarcat 
faptul că formula de pierdere este adevărată indiferent de distribuția servirilor. 


Pentru a ca sistemul să fie eficient este necesar ca z, să aibă o valoare sub un 
prag considerat. 


11.6. COZILE DE AŞTEPTARE DE TIPUL (W/G/1) 


Acestea sunt cozi în care sosirile sunt procese Poisson cu rata 4 > 0 şi în care 
timpii de servire a cererilor sunt independente cu aceeaşi funcţie cumulată a 
distribuţiei G(t). In termeni probabilistici spunem ca dacă s, şi s, sunt timpii de 
servire a cererii i şi j unde iz j atunci: s; şi s, variabile aleatoare independente; şi 


G(t)= P(s, < t)= Pls, <¢)vr=0. 


Media timpului de servire este E [S, ] =E |s E E [8]= l/u unde yw este rata 
servirii. Abaterea standard a timpilor de servire este E ls, -E [B]? |- Op. Ordinea de 
tratare a cererilor se presupune a fi primul venit primul servit. Raportul 4/4 se 
notează cu p. 


Numărul de cereri din sistem nu se mai supune regulilor procesului Markov. 
Chiar dacă nu mai putem beneficia de avantajele acestui tip proces, totuşi 
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caracteristicile acestui tip de coadă (lungime, timp de aşteptare, timp în sistem) pot fi 
deduse. Mai întâi ca calculăm T, timpul mediu de aşteptare pentru a fi servit. Acesta 


este timpul pe care un „client” îl petrece în „sala de aşteptare”. Acesta este timpul 
mediu de aşteptare pentru încheierea sarcinii în curs la care se adună suma timpilor de 
servire a cererilor care aşteptă. 


«-EÎB] (83) 
Unde : 


eT, timpul mediu de aşteptare pentru terminarea pentru încheierea 
procesării în curs. 
N. numărul mediu de cereri care aşteaptă; 


e 
e E|B] timpul mediu de servire; 


T, este timpul pe care îl are de aşteptat cel care intră în coada de aşteptare 


pentru a se încheia de procesat cererea în curs. Dacă în sistem nu este nimeni atunci 
Tk =0. 


Conform legii lui Little media lungimii cozii este: 


N, =AT (84) 


Cc c 


Înlocuind obținem: 


Tr 
l- p 


(85) 


Cc 


7, =7, +47, -£[8)= 7, -47, =7, =F. = 
u 


Acum trebuie să calculăm valoare Tę. Pentru o mai bună înțelegere să 
reprezentăm timpul rămas pentru fiecare dintre cererile de servire. 


S; S2 S3 S; Sir Si+2 Sn t 


Fig. 115 Timpul rămas până la sfârşitul servirii 
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Fiecare dintre triunghiurile din figură este drept şi isoscel. Numărul de 
triunghiuri este dat de rata sosirilor 7 = AT, . 


Ty =4[ rele =1S[ sp |= 22 2S 3 (86) 
ae: , i t2] Deal ui 


La limită, pentru starea staționară, 7, ia forma: 


= | 
7, = 5 AE|s" (87) 
Revenind la timpul de asteptare in coada pentru a fi servit obtinem: 


Az|s?| 
2(1- p) 


Aceasta este formula Pollaczek-Hincin pentru medie. Calculând E |s >| 


f = 


(88) 


rezulta: 


T- akele)? + A E Ap +02] 


(89) 
2(1- p) 2(1- p) 
Timpul total de asteptare este: 
2, 2 
7-7 + elg]- Ap? real 1 (90) 
Al-p) x 
Corespunzător se calculează numărul de cereri din coadă: 
2, 2 2 
Negra l» +03] (91) 
2(1- p) 
şi respectiv: 
2 2 2, 
year = FU +a], , (92) 


Aceste formule sunt suficient de generale prin condiţiile impuse. 


Pentru verificare să considerăm cazul (M IMI 1) unde E [8] = 03! 
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= _ Akela)? +o] _ alo +p?]_ a 
T= 93 
21-7) 212) UA a 
Şi 
F._?P il Spal. p l 2-3 (94) 


“php (ph (ip ued) 


Valorile obținute sunt identice cu cele calculate la subcapitolul anterior 
corespunzător. 


11.7. ANALIZA COZILOR DE TIPUL (M/G/-/-/N) 


O clasă de cozi care poate fi remarcată este (M/G/-/-/N) care este 


caracterizată prin faptul că populația care generează intrările este limitată. Aceasta 
înseamnă că pe măsură ce în coada de aşteptare se acumulează cereri sau clienți, în 
exterior rămân mai puţine entități care să genereze cereri de servire. Rata intrărilor va 
scădea proporțional cu scăderea populaţiei externe. Deci rata intrărilor nu mai este 
fixă, ca la situaţiile precedente, ci variabilă după o anumită lege. 


Pentru exemplificare vom considera cazul sistemelor cu coadă de aşteptare 
(M/M/1//N). 


Acest tip de coada de asteptare este caracterizat de prezenta unui singur post 
de servire cu distribuţia timpului de servire de tip exponential cu parametrul yw, 


numărul de locuri în coadă este „infinit”, sosirea se face aleator cu distribuţia timpilor 
de sosire de tip exponential. Populaţia externă este N , de aceea sunt în fapt necesare 
doar N locuri în coada de aşteptare. Elementele ee considerate sunt identice Şi 


000900 - 9:90 


nS ig. 116 pea ae ee (4747118) 
Aplicând ecuaţiile (25) şi (26) rezultă: 


1 NA, 


T NÀ, = UT > T = (95) 
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Şi 


n, = Vegt = er (96) 


pentru i= 1,2,3,4,..., N. Relaţia se verifică de fapt şi pentru i=0. De aceea 
putem scrie: 


nad m2) T |=1 (97) 


A i 
Notând cu a:=—, obţinem: 
u 


i=0 


na zi (98) 


Adică probabilitatea ca în sistem să nu fie nici o cerere este 


. -1 
Ty = ma, > =) (99) 


i=0 


Celelalte probabilitati se calculează aplicând corespunzător ecuaţiile (96). 
11.8. COZI DE AŞTEPTARE CU PRIORITATE 


NOȚIUNI GENERALE 


Nu totdeauna cererile.icare aşteaptă servirea într-o coadă sunt egale din 
punctul de vedere al celui care face servirea. Unii clienţi au prioritate în faţa altora. 
Prioritatea poate fi continuă sau discretă (se împart cererile în câteva clase de 
prioritate şi se face departajarea între ei). Această prioritate poate fi stabilită la intrare 
în coadă şi rămâne fixă pe durata aşteptării sau se poate modifica pe parcurs. 


Exemple de cereri de servire cu prioritate fixă sunt vehiculele poliţiei, 
salvării, pompierilor care pot trece pe culoarea roşie a semaforului în timp ce celelalte 
stau în coada de aşteptare formată. 


Un exemplu de prioritate ce se modifică pe parcurs este dat de coada de 
aşteptare la ANL! pentru construirea de case pentru tineri. Prioritatea este dată de o 


' Agenţia Naţională a Locuintei 
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serie de factori legaţi de situația familială, de venituri dar şi de timpul petrecut în 
coada de aşteptare. Deoarece servirea în acest caz se face pe loturi, de fiecare dată 
când se face o servire se reevaluează prioritatea. 


Pentru cazul în care se asociază o prioritate fixă, cererile care au aceeaşi 
prioritate sunt servite într-o ordine dintre cele descrise în sub-capitolul introductiv (de 
obicei ordinea este primul sosit primul servit). În general se asociază un indice de 
prioritate. Se face convenţia că un indice de valoare mai mică reprezintă o prioritate 
mai mare. 


Sistemele cu cozi de aşteptare cu priorități pot reacţiona diferit la o cerere 
prioritară când în curs de servire se află o cerere cu o prioritate mai scăzută. Aceste 
cereri pot să aştepte sau pot bloca servirea în curs luându-i locul. 


Funcție de modul de tratare a cererilor sistemele cu cozi de aşteptare cu 
priorităţi pot fi: 


II) 


o fără întrerupere (eng. non-preemptive) — cererile cu o prioritate mai scăzută 
aflate în procesul de servire nu sunt întrerupte de sosirea unei cereri mai 
prioritare; 

© cu întrerupere (eng. preemptive) — cererile aflate în servire sunt întrerupte 
pentru a face loc servirii unei cereri de prioritate mai mare. 

e cu întrerupere reluată (eng. preemptive resume) — cererile 
întrerupte sunt reluate exact de unde au fost lăsate şi operaţia se 
continuă până la închiere sau la sosirea unei alte cereri prioritare. 

e cu întrerupere repetată (eng. preemptive repeat) — cererile 
întrerupte sunt reluate de la început, operaţiile deja efectuate se 
pierd. 


COZI DE AŞTEPTARE CU PRORITATE ŞI ÎNTRERUPERE 


Acest tip de coadă de aşteptare va procesa întotdeauna o cerere cu cea mai 
înaltă prioritate. Pentru rezolvarea cozilor de tip (M /M/-/ —) cu prioritate vom trasa 


diagrama tranzitiilor (este vorba de procese Poisson) şi se vor trata sistemele de 
ecuaţie rezultate obținând probabilitățile stărilor. 


Vom începe analiza prin prezentarea cozilor de tip (M /M/ 1) cu prioritate. 
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Fig. 117 Diagrama tranzitiilor pentru cozile de aşteptare (M/M/1) cu două 
niveluri de prioritate 


Pentru rezolvarea acestui tip de sistem trebuie să scriem ecuaţiile de echilibru 
în fiecare nod. 


Ca un exemplu vom considera sistemul de tip (M/M /1/3) care are două 


niveluri de prioritate. Acest tip de coadă de aşteptare ar putea fi un model pentru un 
atelier de reparaţii care are doar trei locuri inclusiv cel de pe rampă. Sarcina sa este de 
a repara prioritar maşinile proprii ale organizaţiei care patronează atelierul (ex. o 
antrepriză de lucrări drumuri şi poduri), dar din motive de autofinantare acceptă cereri 
de la populaţie. Regulamentul spune că dacă o maşină a organizaţiei solicită o 
reparaţie şi există locuri libere, reparația unei maşini externe este întreruptă şi maşina 
proprie este reparată. Maşinile de aceeaşi prioritate se tratează după disciplina primul 
sosit primul servit. Cererile deja acceptate (maşinile externe au plătit deja avans) nu 
pot fi eliminate. Dacă toate locurile sunt ocupate atunci cererea este directată spre alt 
atelier. 


Pentru cazul (M IMIL 3) cu două niveluri de prioritate diagrama tranzitiilor 
are următoarea formă: 
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P 
My Bo 


vw a 
oo a 


Fig. 118 Diagrama tranzitiilor pentru cozile de aşteptare (M/M/1/3) cu două 


niveluri de prioritate 


Analizând mulțimea stărilor posibile şi considerând echilibrul în noduri, 


pentru starea staționară putem scrie: 


Tooli + Ay) = T of + Tok, 

Tio (A, +A, + Ly ) = Mo oh + T3 04h, 
(Ay +Å, + fy ) = To of + MM + To» 
Tia (A, +A, + 44 ) = My hy t+ Mody + Mh» 
Tao (A, +A, + 44 ) = 719A, +73 0445 
Top (A, +A, + My ) = Zob + Moh + Zob» 
Ta My = TA +T of, 

Ti oft, = MA, + Pooh 
T3 oh = Hy oA > 
To 3k = Toz 


La ecuațiile anterioare se adaugă: 


Too + Tio + Ho, + M14 +229 +202 ta +a +739 +73 =] 


Din rezolvarea ecuatiilor se obtine distributia probabilitatilor. 


(100) 


(101) 
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11.9. REȚELE CU COZI DE AŞTEPTARE 


Cazurile studiate anterior sunt doar situaţii în care avem sisteme cu singură 
coadă de aşteptare izolată. În practică însă, aceste sisteme sunt conectate între ele şi 
formează rețele de cozi de aşteptare care trebuie considerate şi studiate în 
complexitatea lor. O cerere de servire aşteaptă într-o coadă, este rezolvată după care 
trece în alta şi aşa mai departe. În final un client poate să iasă din sistem sau poate să 
reia procesul de la început. 


O reţea cu cozi de aşteptare poate fi deschisă sau închisă. 


Într-o reţea deschisă, cererea / clientul vine din exteriorul sistemului, 
parcurge cozile în totalitate sau în parte şi părăseşte sistemul. De obicei, în acest caz, 
se consideră că populația de cereri / clienţi este infinită. Sistemul poate conţine 
conexiuni inverse şi puncte de despărţire. Cozile de aşteptare pot avea stabilite 


priorități. 
4 
a Lez, Tez 


Le, Tes Les , Tes 
03 25 B > 


Les, Tea | Les , Tes 
14 16 l 


47 = 19 
Lor, Te A Leo, Teo 
Les , Tes | 


Fig. 119 Exemplu schematic de rețea deschisă cu cozi de aşteptate 


În figura de mai sus se poate vedea modelul unui sens de circulaţie pe un 
bulevard. Autovehiculele intră în sistem, parcurg primul segment intră în intersecția 
A, aşteaptă la semafor, trec şi intră in intersecţia B unde, din nou, trebuie să aştepte la 
semafor. Din anumite considerente în a doua intersecție este interzisă întoarcerea la 
stânga. De aceea, în intersecția anterioară (A) trebuie să ocolim pe o stradă laterală şi 
să venim în intersecția B perpendicular pe bulevard. 


Fiecare dintre fluxurile de vehicule este modelat prin cozi de aşteptare 
separate şi puncte în care traficul se împarte pe direcții diferite. 


Reţeaua închisă presupune că întreaga populație care poate genera cereri de 
servire este cuprinsă în interiorul sistemului. 
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[e 4 
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2 A4 


16 17 
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L----! 
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M i 


Fig. 120 Exemplu schematic de reţea închisă cu cozi de aşteptate 
În practică, traficul trece prin mai mult de un nod. Ca o consecință, vehiculele 


rețea de cozi de aşteptare. Rețelele pot fi studiate sub diferite presupuneri privi 
distribuţia sosirilor, distribuția servirii, disciplina servirii, dimensiunea zonei de 


aşteptare etc. (Balsamo et al. 2001 [181]). 


Recensămintele de trafic anterioare ne pot indica numărul de vehicule pe 
intervale de timp pentru fiecare zi a săptămânii. Acestea ar fi spsirilă. Pe de altă parte 
fiecare sector rutier are o anumită capacitate maximă. O anâliză preliminară poate 
porni de presupunerea că fluxul de vehicule şi procesul de trecere sunt deterministice. 


Nu este o realitate ci doar o aproximare convenabilă utilizată în procesul de modelare. 


Pentru a avea rezultate cât mai corecte ar trebui să presupunem o reţea 
deschisă cu cozi de aşteptare (G/ G/ 1) (Vandaele et al. 1999 [218]). Modelul 


(M IMI 1) a fost intens utilizat din cauza simplităţii, dar nu este util fiind departe de 
realitate. Pentru benzi multiple Jain şi Smith au dezvoltat un model (G/G/k) [195]. 


În condiţii de trafic necongestionat, Van Woense şi Vandaele au demonstrat că cel 
mai bun model ce se poate obţine este (M /G/ 1) [216]. 
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